Přihlášení | Registrace

napište » Zprávičky

Firefox 143.0

včera 21:44 | Nová verze

Byl vydán Mozilla Firefox 143.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Nově se Firefox při ukončování anonymního režimu zeptá, zda chcete smazat stažené soubory. Dialog pro povolení přístupu ke kameře zobrazuje náhled. Obzvláště užitečné při přepínání mezi více kamerami. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 143 bude brzy k dispozici také na Flathubu a Snapcraftu.

Ladislav Hagara | Komentářů: 0

Fedora Linux 43 Beta

včera 17:22 | Nová verze

Byla vydána betaverze Fedora Linuxu 43 (ChangeSet), tj. poslední zastávka před vydáním finální verze, která je naplánována na úterý 21. října.

Ladislav Hagara | Komentářů: 0

Ghostty 1.2

včera 12:22 | Nová verze

Multiplatformní emulátor terminálu Ghostty byl vydán ve verzi 1.2 (𝕏, Mastodon). Přehled novinek, vylepšení a nových efektů v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Godot 4.5

včera 00:11 | Nová verze

Byla vydána nová verze 4.5 (𝕏, Bluesky, Mastodon) multiplatformního open source herního enginu Godot (Wikipedie, GitHub). Přehled novinek i s náhledy v příspěvku na blogu.

Ladislav Hagara | Komentářů: 0

asciinema CLI 3.0

15.9. 21:33 | Nová verze

Byla vydána verze 3.0 (Mastodon) nástroje pro záznam a sdílení terminálových sezení asciinema (GitHub). S novou verzí formátu záznamu asciicast v3, podporou live streamingu a především kompletním přepisem z Pythonu do Rustu.

Ladislav Hagara | Komentářů: 0

Canonical oznámil, že bude podporovat a distribuovat toolkit NVIDIA CUDA v Ubuntu

15.9. 21:00 | Komunita

Canonical oznámil, že bude podporovat a distribuovat toolkit NVIDIA CUDA (Wikipedie) v Ubuntu.

Ladislav Hagara | Komentářů: 0

Hodnota společnosti Alphabet překonala hranici tří bilionů dolarů

15.9. 20:44 | IT novinky

Tržní hodnota americké společnosti Alphabet, která je majitelem internetového vyhledávače Google, dnes poprvé překonala hranici tří bilionů dolarů (62,1 bilionu Kč). Alphabet se připojil k malé skupině společností, které tuto hranici pokořily. Jsou mezi nimi zatím americké firmy Nvidia, Microsoft a Apple.

Ladislav Hagara | Komentářů: 2

Washington a Peking se dohodly na pokračování TikToku v USA

15.9. 20:33 | IT novinky

Spojené státy a Čína dosáhly dohody ohledně pokračování populární čínské platformy pro sdílení krátkých videí TikTok v USA. V příspěvku na síti Truth Social to dnes naznačil americký prezident Donald Trump. Dosažení rámcové dohody o TikToku vzápětí oznámil americký ministr financí Scott Bessent, který v Madridu jedná s čínskými představiteli o vzájemných obchodních vztazích mezi USA a Čínou. Bessentova slova později potvrdila také čínská strana.

Ladislav Hagara | Komentářů: 0

MKVToolNix 95.0. Podpora Matrosky míří do Firefoxu

15.9. 16:55 | Komunita

MKVToolNix, tj. sada nástrojů pro práci s formátem (medialnym kontajnerom) Matroska, byl vydán ve verzi 95.0. Podpora přehrávání formátu Matroska míří do Firefoxu [Bug 1422891, Technický popis]. Přehrávání lze již testovat ve Firefoxu Nightly.

Ladislav Hagara | Komentářů: 0

Pozvánka na 211. sraz spolku OpenAlt

13.9. 17:33 | Pozvánky

Spolek OpenAlt zve příznivce otevřených řešení a přístupu na 211. sraz, který proběhne v pátek 19. září od 18:00 ve Studentském klubu U Kachničky na Fakultě informačních technologií Vysokého učení technického na adrese Božetěchova 2/1. Na srazu proběhne přednáška Jiřího Eischmanna o nové verzi prostředí GNOME 49. Nemáte-li možnost se zúčastnit osobně, přednáškový blok bude opět streamován živě na server VHSky.cz a následně i zpřístupněn záznam.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Pro otevření více webových stránek ve webovém prohlížečí používám

Taby (81%)

Panely (6%)

Záložky (4%)

Listy (3%)

Něco jiného (4%)

Nic (2%)

Celkem 187 hlasů

Komentářů: 12, poslední 10.9. 13:00

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / perl - pocet vyskytov retazca v texte

Štítky: IDE, Perl, programování

Dotaz: perl - pocet vyskytov retazca v texte

13.3.2006 12:14 hrobar | skóre: 13
perl - pocet vyskytov retazca v texte

Přečteno: 215×

Odpovědět | Admin

Trocha som hral v perle s regularnymi vyrazmi a skusal som naprogramovat skriptik, ktory pocita pocet vyskytov retazca v texte. Skript vyzera takto:

#!/usr/bin/perl -w                                                              
use strict;                                                                     
                                                                                
open(FAJL,$ARGV[0]);                                                            
my @lines = < FAJL >                                                             
close(FAJL);                                                                    
                                                                                
my $i;                                                                          
my $vyskyt=0;                                                                   
                                                                                
for ( $i=0; $i<(scalar @lines)-1; $i++ ) {                                      
                                                                                
$vyskyt += ($lines[$i] =~ tr/msgstr/msgstr/);                                   
                                                                                                                                                                
}                                                                               
                                                                                
print $vyskyt."\n";

Ako vstup je pouzity po subor pre lokalizaciu isteho programu. Subor ma 3265 riadkov. Retazec msgstr sa vyskytuje na riadku maximalne jedenkrat, navyse sa nevyskytuje na kazdom riadku a v pocte riadkov su zahrnute aj prazdne riadky. Kazdopadne pocet msgstr nema sancu prekrocit hranicu 3265 vyskytov. Pocet vyskytov by sa mal pohybovat niekde v rozpati 600-700 vyskytov. Avsak po spusteni skriptiku mi to hodi cislo 20850 vyskytov. Cim je to sposobene?

Nástroje: Začni sledovat (1) ?

Odpovědi

13.3.2006 12:31 michich
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

Protoze tim ve skutecnosti pocitas, kolikrat se v textu vyskytuji pismenka m,s,g,t,r.

13.3.2006 12:33 michich
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

Zmen to na: $vyskyt += ($lines[$i] =~ /msgstr/); a melo by to fungovat.

13.3.2006 12:57 hrobar | skóre: 13
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

Tiez som mal pocit ze sa 'tr' na retazce neda aplikovat. Ide to aj nahradou 's' za 'tr' ale to tvoje riesenie je elegantnejsie. btw. ked regularnemu vyrazu neudam o co ide (s,tr,m) tak sa automaticky pocita s tym, ze ide o pattern matching teda 'm'? Inak povedane =~ /msgstr/ je to iste ako =~ m/msgstr/?

13.3.2006 14:30 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

RTFM
RTFM
RTFM

Tak dobrá

tr není s ani m
Když hledaný řeťezec nemůže přesahovat konec řádku, tak jen naprostý programátorský někňuba bude načítat do paměti celý soubor a i tak by to programátor, jen trochu zběhlý v perlu, udělal mnohem elegantněji takto:
```
#!/usr/bin/env perl
use warnings;
use strict;
undef $/;
my $vyskyt=0;
$_ = <>;
$vyskyt++ while m/msgstr/g;
print $vyskyt,"\n";
```
Trošku zkušenější třeba takto
```
#!/usr/bin/env perl
use warnings;
use strict;
undef $/;
print scalar @{[<> =~ m/msgstr/g]}, "\n";
```

Jenže protože takový programátor nebude trouba a nebude načítat celý soubor do paměti, tak to udělá třeba takto:

#!/usr/bin/env perl
use warnings;
use strict;
my $vyskyt = 0;
$vyskyt += @{[m/msgstr/g]} while <> ;
print $vyskyt,"\n";

Nebo dokonce jako onliner

perl -ne '$vyskyt += @{[m/msgstr/g]}; END{print $vyskyt,"\n"}'

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

13.3.2006 15:22 hrobar | skóre: 13
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

1. Ja som ani netvrdil ze tr=s=m. tr=translation, s=substitution, m=pattern matching.

2. Nie vsetci su taky super spica neomylne dokonaly programatori ako ty.

3. Diky za riesenia. Konecne som pochopil preco je perl "chlpaty".

4. Nebolo by od veci keby si popri tom urazani odpovedal na otazku, ktoru som polozil a sice je =~ /msgstr/ to iste ako =~ m/msgstr/? Odpoviem si sam, je.

13.3.2006 16:42 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

to imho nebolo urážanie :-)

btw, ešte môžeš skúsiť nasledovné:

$vyskyt = grep { m/msgstr/ } <>;

# alebo

print scalar grep { m/msgstr/ } <>;

to platí pre jeden riadok = jeden výskyt. Inak možno použiť i nasledovnú konštrukciu:

$/ = 'msgstr';
1 while <>;
print $., "\n";

13.3.2006 18:01 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

Inak možno použiť i nasledovnú konštrukciu:
$/ = 'msgstr';
1 while <>;
print $., "\n";

Máš bod

Ale správně to má být

$/ = 'msgstr';
1 while <>;
print $. - 1, "\n";

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

13.3.2006 18:15 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

hmm, máš pravdu :-)

TIMTOWDI ...

undef $/;
print -1 + scalar split (/msgstr/, <>), "\n";

14.3.2006 08:58 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

Hezké, akorat to scalar je tam zbytečné, protože + to přepne do skalárního kontextu. Použít split mě nenapadlo a přitom je to tak hezké :-)

Jako one liner a bez načítání všeho naráz to pak může být třeba

perl -ne '$a+=-1+split/msgstr/; END{print "$a\n"}'

Ale když už jsme u toho splitu, tak hezčí by bylo

perl -Fmsgstr -ane '$a+=-1+@F; END{print "$a\n"}'

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

14.3.2006 09:00 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

Můžem ještě ušetřit znak

perl -Fmsgstr -ane'$a+=@F-1;END{print "$a\n"}'

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

14.3.2006 09:01 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

A ještě jeden :-)

perl -Fmsgstr -ane'$a+=$#F;END{print "$a\n"}'

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

14.3.2006 09:10 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

Pro srovnání neoptimální načtení celého souboru

perl -e'undef$/;print-1+split("msgstr",<>),"\n"'

a nejkratší varianta se čtením po řádcích

perl -Fmsgstr -ane'$a+=$#F;END{print"$a\n"}'

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

14.3.2006 09:20 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

Jen pro pořádek aby byla sbírka kompletní

perl -ne'BEGIN{$/="msgstr"}END{print$.-1,"\n"}'

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

14.3.2006 09:32 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

lol

jeden telefonát počas písania odpovede :-(

((

14.3.2006 09:37 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

ok, ešte jedno vylepšenie ...

perl -ne'BEGIN{$/=shift}END{print$.-1,"\n"}' msgstr

rozdiel oproti nižšie spomenutému grep-u je v počítaní výskytov a nie riadkov s výskytom

14.3.2006 10:06 mrak | skóre: 12 | Olomouc
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

myslel sem ze perl trochu umim ale pichi je demon!
no zrejmne lepsi oddil :)

14.3.2006 09:30 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

)
dúfam, že sme nikoho od perlu neodradili :-)

)

v porovnani so split, resp s $/ má najkratší variant nevýhodu v tom, že hľadaný reťazec nemôže obsahovať new-line ... takže o tri znaky viac

perl -ne'BEGIN{$/="msgstr"}END{print$.-1,"\n"}'

14.3.2006 09:27 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

Jo jentak mimochodem, když chci spočítat počet řádků obsahujících určitý řetězec, tak úplně nejlepší je

grep -c msgstr

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

14.3.2006 12:12 hrobar | skóre: 13
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

Ono to bolo cele trochu inak. Niekde na webe som narazil na nasledovnu konstrukciu $count +=($sentence =~ tr/*/*/). Zhodou okolnosti som pracoval na preklade isteho softu a zacalo mi v hlave vrtat(zo zvedavosti) ako by sa dalo v perle realizovat spocitanie vyskytu vybraneho retazca v urcitom subore, vyuzitim zmienovanej konstrukcie. Neslo mi o to aby to bolo naj a ani o to aby som spocital pocet retazcov v preklade. Tie sa daju lahko spocitat cez msgfmt --statistics your.po a netreba ani nic programovat. Potom si sa objavil ty a prisiel so svojimi minimalistickymi rieseniami, coz je fajn aspon sa nieco priucim. S preliezania webu a citania programov mam vsak skusenost taku, ze riesenia tvojho druhu sa moc nepouzivaju. Preco? Stale vsak uplne nerozumiem ako perl tie znaky pocita. Moj odhad je taky, ze obsah zatvorky vyhodnoti ako boolean a ten potom vrati ako 1 alebo 0. A pretoze ked v '$sentence' najde '*' vrati true co je 1 je mozne tohoto faktu vyuzit napriklad na urcenie poctu znakov v retazci. Mam pravdu, alebo sa mylim?

14.3.2006 13:04 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

RTFM

       tr/SEARCHLIST/REPLACEMENTLIST/cds
       y/SEARCHLIST/REPLACEMENTLIST/cds
               Transliterates all occurrences of the characters found in the
               search list with the corresponding character in the replacement
               list.  It returns the number of characters replaced or deleted.
               If no string is specified via the =~ or !~ operator, the $_
               string is transliterated.  (The string specified with =~ must
               be a scalar variable, an array element, a hash element, or an
               assignment to one of those, i.e., an lvalue.)

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

14.3.2006 13:05 barney
Rozbalit Rozbalit vše Re: perl - pocet vyskytov retazca v texte

tr// vrati počet nahradených alebo zmazaných znakov. v tomto prípade koľko '*' sa nachádza v retazci.

odpoveď na otázku "prečo" je jednoduchá ... drvivá vačšina programátorov sa zastaví pri prvom funkčnom riešení. A ako vidíš aj z tejto diskusie, riešenie iterovalo v niekoľkých krokoch. Nevraviac o tom, že tu sú vypísané asi všetky kroky, podľa toho, kto si kedy na akú vlastnosť spomenul :-)

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje