abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 02:22 | Nová verze

    D7VK byl vydán ve verzi 1.2. Jedná se o fork DXVK implementující překlad volání Direct3D 5, 6 a 7 na Vulkan. DXVK zvládá Direct3D 8, 9, 10 a 11.

    Ladislav Hagara | Komentářů: 0
    dnes 02:00 | Nová verze

    Byla vydána verze 12.0.0 knihovny libvirt (Wikipedie) zastřešující různé virtualizační technologie a vytvářející jednotné rozhraní pro správu virtuálních strojů. Současně byl ve verzi 12.0.0 vydán související modul pro Python libvirt-python. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 19:22 | Humor

    CreepyLink.com je nový zkracovač URL adres, 'díky kterému budou vaše odkazy vypadat tak podezřele, jak je to jen možné'. Například odkaz na abclinuxu.cz tento zkracovač převádí do podoby 'https://netflix.web-safe.link/logger_8oIlgs_free_money.php'. Dle prohlášení autora je CreepyLink alternativou ke zkracovači ShadyURL (repozitář na githubu), který dnes již bohužel není v provozu.

    NUKE GAZA! 🎆 | Komentářů: 2
    včera 12:33 | IT novinky

    Na blogu Raspberry Pi byla představena rozšiřující deska Raspberry Pi AI HAT+ 2 s akcelerátorem Hailo-10 a 8 GB RAM. Na rozdíl od předchozí Raspberry Pi AI HAT+ podporuje generativní AI. Cena desky je 130 dolarů.

    Ladislav Hagara | Komentářů: 3
    včera 12:11 | Komunita

    Wikipedie slaví 25. výročí svého založení. Vznikla 15. ledna 2001 jako doplňkový projekt k dnes již neexistující encyklopedii Nupedia. Doména wikipedia.org byla zaregistrována 12. ledna 2001. Zítra proběhne v Praze Večer svobodné kultury, který pořádá spolek Wikimedia ČR.

    Ladislav Hagara | Komentářů: 1
    včera 04:44 | Nová verze

    Po více než dvou letech od vydání předchozí verze 2.12 byla vydána nová stabilní verze 2.14 systémového zavaděče GNU GRUB (GRand Unified Bootloader, Wikipedie). Přehled novinek v souboru NEWS a v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 2
    včera 02:22 | Nová verze

    Google Chrome 144 byl prohlášen za stabilní. Nejnovější stabilní verze 144.0.7559.59 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 10 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře (YouTube).

    Ladislav Hagara | Komentářů: 4
    včera 01:55 | Humor

    Microsoft zveřejnil zdrojový kód XAML Studia a uvolnil ho pod MIT licencí. XAML Studio je nástroj ze světa Windows, určený pro tvorbu uživatelského rozhraní aplikací pomocí XAML (Extensible Application Markup Language). Stalo se tak zhruba po osmi letech od prvního prohlášení Microsoftu, že se tento kód chystá zveřejnit.

    NUKE GAZA! 🎆 | Komentářů: 0
    včera 01:44 | Zajímavý projekt

    TimeCapsule, 'časová kapsle', je jazykový model trénovaný výhradně na datech z určitých míst a časových období, aby se tak napodobila autentická slovní zásoba, způsob vyjadřování a názory dané doby. Na Hugging face jsou k dispozici modely natrénované na historických textech dostupných v oblasti Londýna mezi lety 1800 až 1875.

    NUKE GAZA! 🎆 | Komentářů: 6
    14.1. 17:55 | Nová verze

    Radicle byl vydán ve verzi 1.6.0 s kódovým jménem Amaryllis. Jedná se o distribuovanou alternativu k softwarům pro spolupráci jako např. GitLab.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (4%)
     (0%)
     (9%)
     (19%)
     (3%)
     (6%)
     (3%)
     (11%)
     (43%)
    Celkem 453 hlasů
     Komentářů: 12, poslední 14.1. 21:12
    Rozcestník

    Dotaz: perl - pocet vyskytov retazca v texte

    13.3.2006 12:14 hrobar | skóre: 13
    perl - pocet vyskytov retazca v texte
    Přečteno: 239×
    Trocha som hral v perle s regularnymi vyrazmi a skusal som naprogramovat skriptik, ktory pocita pocet vyskytov retazca v texte. Skript vyzera takto:
    #!/usr/bin/perl -w                                                              
    use strict;                                                                     
                                                                                    
    open(FAJL,$ARGV[0]);                                                            
    my @lines = < FAJL >                                                             
    close(FAJL);                                                                    
                                                                                    
    my $i;                                                                          
    my $vyskyt=0;                                                                   
                                                                                    
    for ( $i=0; $i<(scalar @lines)-1; $i++ ) {                                      
                                                                                    
    $vyskyt += ($lines[$i] =~ tr/msgstr/msgstr/);                                   
                                                                                                                                                                    
    }                                                                               
                                                                                    
    print $vyskyt."\n"; 
    Ako vstup je pouzity po subor pre lokalizaciu isteho programu. Subor ma 3265 riadkov. Retazec msgstr sa vyskytuje na riadku maximalne jedenkrat, navyse sa nevyskytuje na kazdom riadku a v pocte riadkov su zahrnute aj prazdne riadky. Kazdopadne pocet msgstr nema sancu prekrocit hranicu 3265 vyskytov. Pocet vyskytov by sa mal pohybovat niekde v rozpati 600-700 vyskytov. Avsak po spusteni skriptiku mi to hodi cislo 20850 vyskytov. Cim je to sposobene?

    Odpovědi

    13.3.2006 12:31 michich
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    Protoze tim ve skutecnosti pocitas, kolikrat se v textu vyskytuji pismenka m,s,g,t,r.
    13.3.2006 12:33 michich
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    Zmen to na: $vyskyt += ($lines[$i] =~ /msgstr/); a melo by to fungovat.
    13.3.2006 12:57 hrobar | skóre: 13
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    Tiez som mal pocit ze sa 'tr' na retazce neda aplikovat. Ide to aj nahradou 's' za 'tr' ale to tvoje riesenie je elegantnejsie. btw. ked regularnemu vyrazu neudam o co ide (s,tr,m) tak sa automaticky pocita s tym, ze ide o pattern matching teda 'm'? Inak povedane =~ /msgstr/ je to iste ako =~ m/msgstr/?
    13.3.2006 14:30 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    1. RTFM
    2. RTFM
    3. RTFM
    Tak dobrá
    1. tr není s ani m
    2. Když hledaný řeťezec nemůže přesahovat konec řádku, tak jen naprostý programátorský někňuba bude načítat do paměti celý soubor a i tak by to programátor, jen trochu zběhlý v perlu, udělal mnohem elegantněji takto:
      #!/usr/bin/env perl
      use warnings;
      use strict;
      undef $/;
      my $vyskyt=0;
      $_ = <>;
      $vyskyt++ while m/msgstr/g;
      print $vyskyt,"\n";
      
      Trošku zkušenější třeba takto
      #!/usr/bin/env perl
      use warnings;
      use strict;
      undef $/;
      print scalar @{[<> =~ m/msgstr/g]}, "\n";
    3. Jenže protože takový programátor nebude trouba a nebude načítat celý soubor do paměti, tak to udělá třeba takto:
      #!/usr/bin/env perl
      use warnings;
      use strict;
      my $vyskyt = 0;
      $vyskyt += @{[m/msgstr/g]} while <> ;
      print $vyskyt,"\n";
      
      Nebo dokonce jako onliner
      perl -ne '$vyskyt += @{[m/msgstr/g]}; END{print $vyskyt,"\n"}'
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    13.3.2006 15:22 hrobar | skóre: 13
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    1. Ja som ani netvrdil ze tr=s=m. tr=translation, s=substitution, m=pattern matching.

    2. Nie vsetci su taky super spica neomylne dokonaly programatori ako ty.

    3. Diky za riesenia. Konecne som pochopil preco je perl "chlpaty".

    4. Nebolo by od veci keby si popri tom urazani odpovedal na otazku, ktoru som polozil a sice je =~ /msgstr/ to iste ako =~ m/msgstr/? Odpoviem si sam, je.
    13.3.2006 16:42 barney
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    to imho nebolo urážanie :-)

    btw, ešte môžeš skúsiť nasledovné:

    $vyskyt = grep { m/msgstr/ } <>;
    
    # alebo
    
    print scalar grep { m/msgstr/ } <>;
    

    to platí pre jeden riadok = jeden výskyt. Inak možno použiť i nasledovnú konštrukciu:
    $/ = 'msgstr';
    1 while <>;
    print $., "\n";
    
    13.3.2006 18:01 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    Inak možno použiť i nasledovnú konštrukciu:
    $/ = 'msgstr';
    1 while <>;
    print $., "\n";
    
    Máš bod :-) Ale správně to má být
    $/ = 'msgstr';
    1 while <>;
    print $. - 1, "\n";
    
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    13.3.2006 18:15 barney
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    hmm, máš pravdu :-)

    TIMTOWDI ...
    undef $/;
    print -1 + scalar split (/msgstr/, <>), "\n";
    
    14.3.2006 08:58 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    Hezké, akorat to scalar je tam zbytečné, protože + to přepne do skalárního kontextu. Použít split mě nenapadlo a přitom je to tak hezké :-) Jako one liner a bez načítání všeho naráz to pak může být třeba
    perl -ne '$a+=-1+split/msgstr/; END{print "$a\n"}'
    Ale když už jsme u toho splitu, tak hezčí by bylo
    perl -Fmsgstr -ane '$a+=-1+@F; END{print "$a\n"}'
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    14.3.2006 09:00 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    Můžem ještě ušetřit znak
    perl -Fmsgstr -ane'$a+=@F-1;END{print "$a\n"}'
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    14.3.2006 09:01 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    A ještě jeden :-)
    perl -Fmsgstr -ane'$a+=$#F;END{print "$a\n"}'
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    14.3.2006 09:10 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    Pro srovnání neoptimální načtení celého souboru
    perl -e'undef$/;print-1+split("msgstr",<>),"\n"'
    a nejkratší varianta se čtením po řádcích
    perl -Fmsgstr -ane'$a+=$#F;END{print"$a\n"}'
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    14.3.2006 09:20 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    Jen pro pořádek aby byla sbírka kompletní
    perl -ne'BEGIN{$/="msgstr"}END{print$.-1,"\n"}'
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    14.3.2006 09:32 barney
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    lol :-)
    jeden telefonát počas písania odpovede :-(((
    14.3.2006 09:37 barney
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    ok, ešte jedno vylepšenie ...
    perl -ne'BEGIN{$/=shift}END{print$.-1,"\n"}' msgstr
    
    rozdiel oproti nižšie spomenutému grep-u je v počítaní výskytov a nie riadkov s výskytom
    14.3.2006 10:06 mrak | skóre: 12 | Olomouc
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    myslel sem ze perl trochu umim ale pichi je demon!
    no zrejmne lepsi oddil :)
    14.3.2006 09:30 barney
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    :-))
    dúfam, že sme nikoho od perlu neodradili :-))

    v porovnani so split, resp s $/ má najkratší variant nevýhodu v tom, že hľadaný reťazec nemôže obsahovať new-line ... takže o tri znaky viac

    perl -ne'BEGIN{$/="msgstr"}END{print$.-1,"\n"}' 
    
    14.3.2006 09:27 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    Jo jentak mimochodem, když chci spočítat počet řádků obsahujících určitý řetězec, tak úplně nejlepší je
    grep -c msgstr
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    14.3.2006 12:12 hrobar | skóre: 13
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    Ono to bolo cele trochu inak. Niekde na webe som narazil na nasledovnu konstrukciu $count +=($sentence =~ tr/*/*/). Zhodou okolnosti som pracoval na preklade isteho softu a zacalo mi v hlave vrtat(zo zvedavosti) ako by sa dalo v perle realizovat spocitanie vyskytu vybraneho retazca v urcitom subore, vyuzitim zmienovanej konstrukcie. Neslo mi o to aby to bolo naj a ani o to aby som spocital pocet retazcov v preklade. Tie sa daju lahko spocitat cez msgfmt --statistics your.po a netreba ani nic programovat. Potom si sa objavil ty a prisiel so svojimi minimalistickymi rieseniami, coz je fajn aspon sa nieco priucim. S preliezania webu a citania programov mam vsak skusenost taku, ze riesenia tvojho druhu sa moc nepouzivaju. Preco? Stale vsak uplne nerozumiem ako perl tie znaky pocita. Moj odhad je taky, ze obsah zatvorky vyhodnoti ako boolean a ten potom vrati ako 1 alebo 0. A pretoze ked v '$sentence' najde '*' vrati true co je 1 je mozne tohoto faktu vyuzit napriklad na urcenie poctu znakov v retazci. Mam pravdu, alebo sa mylim?
    14.3.2006 13:04 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    RTFM
           tr/SEARCHLIST/REPLACEMENTLIST/cds
           y/SEARCHLIST/REPLACEMENTLIST/cds
                   Transliterates all occurrences of the characters found in the
                   search list with the corresponding character in the replacement
                   list.  It returns the number of characters replaced or deleted.
                   If no string is specified via the =~ or !~ operator, the $_
                   string is transliterated.  (The string specified with =~ must
                   be a scalar variable, an array element, a hash element, or an
                   assignment to one of those, i.e., an lvalue.)
    
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    14.3.2006 13:05 barney
    Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
    tr// vrati počet nahradených alebo zmazaných znakov. v tomto prípade koľko '*' sa nachádza v retazci.

    odpoveď na otázku "prečo" je jednoduchá ... drvivá vačšina programátorov sa zastaví pri prvom funkčnom riešení. A ako vidíš aj z tejto diskusie, riešenie iterovalo v niekoľkých krokoch. Nevraviac o tom, že tu sú vypísané asi všetky kroky, podľa toho, kto si kedy na akú vlastnosť spomenul :-)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.