abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
včera 22:44 | Komunita

Joinup informuje, že Mnichov používá open source groupware Kolab. V srpnu byl dokončen dvouletý přechod na toto řešení. V provozu je asi 60 000 poštovních schránek. Nejenom Kolabu se věnoval Georg Greve ve své přednášce Open Source: the future for the European institutions (SlideShare) na konferenci DIGITEC 2016, jež proběhla v úterý 29. listopadu v Bruselu. Videozáznam přednášek z hlavního sálu je ke zhlédnutí na Livestreamu.

Ladislav Hagara | Komentářů: 1
včera 15:30 | Zajímavý projekt

Společnost Jolla oznámila v příspěvku Case study: Sailfish Watch na svém blogu, že naportovala Sailfish OS na chytré hodinky. Využila a inspirovala se otevřeným operačním systémem pro chytré hodinky AsteroidOS. Použita je knihovna libhybris. Ukázka ovládání hodinek na YouTube.

Ladislav Hagara | Komentářů: 5
včera 14:15 | Nová verze

Byla vydána verze 7.1.0 skriptovacího jazyka PHP používaného zejména k vývoji dynamických webových stránek. Jedná se o první stabilní verzi nejnovější větvě 7.1. Přehled novinek v dokumentaci. Podrobnosti v ChangeLogu. K dispozici je také příručka pro přechod z PHP 7.0.x na PHP 7.1.x.

Ladislav Hagara | Komentářů: 0
včera 12:55 | Nová verze

Google Chrome 55 byl prohlášen za stabilní. Nejnovější stabilní verze 55.0.2883.75 tohoto webového prohlížeče přináší řadu oprav a vylepšení (YouTube). Opraveno bylo také 36 bezpečnostních chyb. Mariusz Mlynski si například vydělal 22 500 dolarů za 3 nahlášené chyby (Universal XSS in Blink).

Ladislav Hagara | Komentářů: 4
včera 11:55 | Pozvánky

Máte rádi svobodný software a hardware nebo se o nich chcete něco dozvědět? Přijďte na 135. sraz spolku OpenAlt, který se bude konat ve čtvrtek 8. prosince od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Sraz bude tentokrát tématický. Bude retro! K vidění budou přístroje jako Psion 5mx nebo Palm Z22. Ze svobodného hardwaru pak Openmoko nebo čtečka WikiReader. Přijďte se i vy pochlubit svými legendami, nebo alespoň na pivo. Moderní hardware má vstup samozřejmě také povolen.

xkucf03 | Komentářů: 0
včera 00:10 | Nová verze

Byla vydána verze 3.2 svobodného systému pro detekci a prevenci průniků a monitorování bezpečnosti počítačových sítí Suricata. Z novinek lze zmínit například podporu protokolů DNP3 a CIP/ENIP, vylepšenou podporu TLS a samozřejmě také aktualizovanou dokumentaci.

Ladislav Hagara | Komentářů: 0
1.12. 21:00 | Nová verze

Byla vydána beta verze Linux Mintu 18.1 s kódovým jménem Serena. Na blogu Linux Mintu jsou hned dvě oznámení. První o vydání Linux Mintu s prostředím MATE a druhé o vydání Linux Mintu s prostředím Cinnamon. Stejným způsobem jsou rozděleny také poznámky k vydání (MATE, Cinnamon) a přehled novinek s náhledy (MATE, Cinnamon). Linux Mint 18.1 bude podporován až do roku 2021.

Ladislav Hagara | Komentářů: 0
1.12. 16:42 | Nová verze

Byl vydán Devuan Jessie 1.0 Beta 2. Jedná se o druhou beta verzi forku Debianu bez systemd představeného v listopadu 2014 (zprávička). První beta verze byla vydána v dubnu letošního roku (zprávička). Jedna z posledních přednášek věnovaných Devuanu proběhla v listopadu na konferenci FSCONS 2016 (YouTube, pdf).

Ladislav Hagara | Komentářů: 0
1.12. 15:16 | Komunita

Na GOG.com začal zimní výprodej. Řada zlevněných her běží oficiálně také na Linuxu. Hru Neverwinter Nights Diamond lze dva dny získat zdarma. Hra dle stránek GOG.com na Linuxu neběží. Pomocí návodu ji lze ale rozběhnout také na Linuxu [Gaming On Linux].

Ladislav Hagara | Komentářů: 1
1.12. 13:14 | Bezpečnostní upozornění

Byla vydána verze 2.7.1 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Řešeno je několik bezpečnostních problémů. Aktualizován byl především Tor Browser na verzi 6.0.7. Tor Browser je postaven na Firefoxu ESR (Extended Support Release) a právě ve Firefoxu byla nalezena a opravena vážná bezpečnostní chyba MFSA 2016-92 (CVE-2016-9079, Firefox SVG Animation

… více »
Ladislav Hagara | Komentářů: 0
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (24%)
 (29%)
 (7%)
 (5%)
 (3%)
Celkem 759 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama

Dotaz: perl - pocet vyskytov retazca v texte

13.3.2006 12:14 hrobar | skóre: 13
perl - pocet vyskytov retazca v texte
Přečteno: 169×
Trocha som hral v perle s regularnymi vyrazmi a skusal som naprogramovat skriptik, ktory pocita pocet vyskytov retazca v texte. Skript vyzera takto:
#!/usr/bin/perl -w                                                              
use strict;                                                                     
                                                                                
open(FAJL,$ARGV[0]);                                                            
my @lines = < FAJL >                                                             
close(FAJL);                                                                    
                                                                                
my $i;                                                                          
my $vyskyt=0;                                                                   
                                                                                
for ( $i=0; $i<(scalar @lines)-1; $i++ ) {                                      
                                                                                
$vyskyt += ($lines[$i] =~ tr/msgstr/msgstr/);                                   
                                                                                                                                                                
}                                                                               
                                                                                
print $vyskyt."\n"; 
Ako vstup je pouzity po subor pre lokalizaciu isteho programu. Subor ma 3265 riadkov. Retazec msgstr sa vyskytuje na riadku maximalne jedenkrat, navyse sa nevyskytuje na kazdom riadku a v pocte riadkov su zahrnute aj prazdne riadky. Kazdopadne pocet msgstr nema sancu prekrocit hranicu 3265 vyskytov. Pocet vyskytov by sa mal pohybovat niekde v rozpati 600-700 vyskytov. Avsak po spusteni skriptiku mi to hodi cislo 20850 vyskytov. Cim je to sposobene?

Odpovědi

13.3.2006 12:31 michich
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
Protoze tim ve skutecnosti pocitas, kolikrat se v textu vyskytuji pismenka m,s,g,t,r.
13.3.2006 12:33 michich
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
Zmen to na: $vyskyt += ($lines[$i] =~ /msgstr/); a melo by to fungovat.
13.3.2006 12:57 hrobar | skóre: 13
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
Tiez som mal pocit ze sa 'tr' na retazce neda aplikovat. Ide to aj nahradou 's' za 'tr' ale to tvoje riesenie je elegantnejsie. btw. ked regularnemu vyrazu neudam o co ide (s,tr,m) tak sa automaticky pocita s tym, ze ide o pattern matching teda 'm'? Inak povedane =~ /msgstr/ je to iste ako =~ m/msgstr/?
13.3.2006 14:30 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
  1. RTFM
  2. RTFM
  3. RTFM
Tak dobrá
  1. tr není s ani m
  2. Když hledaný řeťezec nemůže přesahovat konec řádku, tak jen naprostý programátorský někňuba bude načítat do paměti celý soubor a i tak by to programátor, jen trochu zběhlý v perlu, udělal mnohem elegantněji takto:
    #!/usr/bin/env perl
    use warnings;
    use strict;
    undef $/;
    my $vyskyt=0;
    $_ = <>;
    $vyskyt++ while m/msgstr/g;
    print $vyskyt,"\n";
    
    Trošku zkušenější třeba takto
    #!/usr/bin/env perl
    use warnings;
    use strict;
    undef $/;
    print scalar @{[<> =~ m/msgstr/g]}, "\n";
  3. Jenže protože takový programátor nebude trouba a nebude načítat celý soubor do paměti, tak to udělá třeba takto:
    #!/usr/bin/env perl
    use warnings;
    use strict;
    my $vyskyt = 0;
    $vyskyt += @{[m/msgstr/g]} while <> ;
    print $vyskyt,"\n";
    
    Nebo dokonce jako onliner
    perl -ne '$vyskyt += @{[m/msgstr/g]}; END{print $vyskyt,"\n"}'
XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
13.3.2006 15:22 hrobar | skóre: 13
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
1. Ja som ani netvrdil ze tr=s=m. tr=translation, s=substitution, m=pattern matching.

2. Nie vsetci su taky super spica neomylne dokonaly programatori ako ty.

3. Diky za riesenia. Konecne som pochopil preco je perl "chlpaty".

4. Nebolo by od veci keby si popri tom urazani odpovedal na otazku, ktoru som polozil a sice je =~ /msgstr/ to iste ako =~ m/msgstr/? Odpoviem si sam, je.
13.3.2006 16:42 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
to imho nebolo urážanie :-)

btw, ešte môžeš skúsiť nasledovné:

$vyskyt = grep { m/msgstr/ } <>;

# alebo

print scalar grep { m/msgstr/ } <>;

to platí pre jeden riadok = jeden výskyt. Inak možno použiť i nasledovnú konštrukciu:
$/ = 'msgstr';
1 while <>;
print $., "\n";
13.3.2006 18:01 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
Inak možno použiť i nasledovnú konštrukciu:
$/ = 'msgstr';
1 while <>;
print $., "\n";
Máš bod :-) Ale správně to má být
$/ = 'msgstr';
1 while <>;
print $. - 1, "\n";
XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
13.3.2006 18:15 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
hmm, máš pravdu :-)

TIMTOWDI ...
undef $/;
print -1 + scalar split (/msgstr/, <>), "\n";
14.3.2006 08:58 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
Hezké, akorat to scalar je tam zbytečné, protože + to přepne do skalárního kontextu. Použít split mě nenapadlo a přitom je to tak hezké :-) Jako one liner a bez načítání všeho naráz to pak může být třeba
perl -ne '$a+=-1+split/msgstr/; END{print "$a\n"}'
Ale když už jsme u toho splitu, tak hezčí by bylo
perl -Fmsgstr -ane '$a+=-1+@F; END{print "$a\n"}'
XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
14.3.2006 09:00 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
Můžem ještě ušetřit znak
perl -Fmsgstr -ane'$a+=@F-1;END{print "$a\n"}'
XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
14.3.2006 09:01 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
A ještě jeden :-)
perl -Fmsgstr -ane'$a+=$#F;END{print "$a\n"}'
XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
14.3.2006 09:10 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
Pro srovnání neoptimální načtení celého souboru
perl -e'undef$/;print-1+split("msgstr",<>),"\n"'
a nejkratší varianta se čtením po řádcích
perl -Fmsgstr -ane'$a+=$#F;END{print"$a\n"}'
XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
14.3.2006 09:20 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
Jen pro pořádek aby byla sbírka kompletní
perl -ne'BEGIN{$/="msgstr"}END{print$.-1,"\n"}'
XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
14.3.2006 09:32 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
lol :-)
jeden telefonát počas písania odpovede :-(((
14.3.2006 09:37 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
ok, ešte jedno vylepšenie ...
perl -ne'BEGIN{$/=shift}END{print$.-1,"\n"}' msgstr
rozdiel oproti nižšie spomenutému grep-u je v počítaní výskytov a nie riadkov s výskytom
14.3.2006 10:06 mrak | skóre: 12 | Olomouc
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
myslel sem ze perl trochu umim ale pichi je demon!
no zrejmne lepsi oddil :)
14.3.2006 09:30 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
:-))
dúfam, že sme nikoho od perlu neodradili :-))

v porovnani so split, resp s $/ má najkratší variant nevýhodu v tom, že hľadaný reťazec nemôže obsahovať new-line ... takže o tri znaky viac

perl -ne'BEGIN{$/="msgstr"}END{print$.-1,"\n"}' 
14.3.2006 09:27 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
Jo jentak mimochodem, když chci spočítat počet řádků obsahujících určitý řetězec, tak úplně nejlepší je
grep -c msgstr
XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
14.3.2006 12:12 hrobar | skóre: 13
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
Ono to bolo cele trochu inak. Niekde na webe som narazil na nasledovnu konstrukciu $count +=($sentence =~ tr/*/*/). Zhodou okolnosti som pracoval na preklade isteho softu a zacalo mi v hlave vrtat(zo zvedavosti) ako by sa dalo v perle realizovat spocitanie vyskytu vybraneho retazca v urcitom subore, vyuzitim zmienovanej konstrukcie. Neslo mi o to aby to bolo naj a ani o to aby som spocital pocet retazcov v preklade. Tie sa daju lahko spocitat cez msgfmt --statistics your.po a netreba ani nic programovat. Potom si sa objavil ty a prisiel so svojimi minimalistickymi rieseniami, coz je fajn aspon sa nieco priucim. S preliezania webu a citania programov mam vsak skusenost taku, ze riesenia tvojho druhu sa moc nepouzivaju. Preco? Stale vsak uplne nerozumiem ako perl tie znaky pocita. Moj odhad je taky, ze obsah zatvorky vyhodnoti ako boolean a ten potom vrati ako 1 alebo 0. A pretoze ked v '$sentence' najde '*' vrati true co je 1 je mozne tohoto faktu vyuzit napriklad na urcenie poctu znakov v retazci. Mam pravdu, alebo sa mylim?
14.3.2006 13:04 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
RTFM
       tr/SEARCHLIST/REPLACEMENTLIST/cds
       y/SEARCHLIST/REPLACEMENTLIST/cds
               Transliterates all occurrences of the characters found in the
               search list with the corresponding character in the replacement
               list.  It returns the number of characters replaced or deleted.
               If no string is specified via the =~ or !~ operator, the $_
               string is transliterated.  (The string specified with =~ must
               be a scalar variable, an array element, a hash element, or an
               assignment to one of those, i.e., an lvalue.)
XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
14.3.2006 13:05 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte
tr// vrati počet nahradených alebo zmazaných znakov. v tomto prípade koľko '*' sa nachádza v retazci.

odpoveď na otázku "prečo" je jednoduchá ... drvivá vačšina programátorov sa zastaví pri prvom funkčnom riešení. A ako vidíš aj z tejto diskusie, riešenie iterovalo v niekoľkých krokoch. Nevraviac o tom, že tu sú vypísané asi všetky kroky, podľa toho, kto si kedy na akú vlastnosť spomenul :-)

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.