Přihlášení | Registrace

napište » Zprávičky

dnes 17:11 | Nová verze

Byl vydán Nextcloud Hub 8. Představení novinek tohoto open source cloudového řešení také na YouTube. Vypíchnout lze Nextcloud AI Assistant 2.0.

Ladislav Hagara | Komentářů: 0

Pharo 12.0

dnes 13:33 | Nová verze

Vyšlo Pharo 12.0, programovací jazyk a vývojové prostředí s řadou pokročilých vlastností. Krom tradiční nadílky oprav přináší nový systém správy ladících bodů, nový způsob definice tříd, prostor pro objekty, které nemusí procházet GC a mnoho dalšího.

Pavel Křivánek | Komentářů: 2

Microsoft zveřejnil na GitHubu zdrojové kódy MS-DOSu 4.0 pod licencí MIT

dnes 04:55 | Zajímavý software

Microsoft zveřejnil na GitHubu zdrojové kódy MS-DOSu 4.0 pod licencí MIT. Ve stejném repozitáři se nacházejí i před lety zveřejněné zdrojové k kódy MS-DOSu 1.25 a 2.0.

Ladislav Hagara | Komentářů: 28

Ubuntu 24.04 LTS Noble Numbat

včera 17:33 | Nová verze

Canonical vydal (email, blog, YouTube) Ubuntu 24.04 LTS Noble Numbat. Přehled novinek v poznámkách k vydání a také příspěvcích na blogu: novinky v desktopu a novinky v bezpečnosti. Vydány byly také oficiální deriváty Edubuntu, Kubuntu, Lubuntu, Ubuntu Budgie, Ubuntu Cinnamon, Ubuntu Kylin, Ubuntu MATE, Ubuntu Studio, Ubuntu Unity a Xubuntu. Jedná se o 10. LTS verzi.

Ladislav Hagara | Komentářů: 13

Videozáznam z Czech Open Source Policy Forum 2024

včera 14:22 | Komunita

Na YouTube je k dispozici videozáznam z včerejšího Czech Open Source Policy Forum 2024.

Ladislav Hagara | Komentářů: 2

Fossil 2.24

včera 13:22 | Nová verze

Fossil (Wikipedie) byl vydán ve verzi 2.24. Jedná se o distribuovaný systém správy verzí propojený se správou chyb, wiki stránek a blogů s integrovaným webovým rozhraním. Vše běží z jednoho jediného spustitelného souboru a uloženo je v SQLite databázi.

Ladislav Hagara | Komentářů: 0

Vivaldi 6.7

včera 12:44 | Nová verze

Byla vydána nová stabilní verze 6.7 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 124. Přehled novinek i s náhledy v příspěvku na blogu. Vypíchnout lze Spořič paměti (Memory Saver) automaticky hibernující karty, které nebyly nějakou dobu používány nebo vylepšené Odběry (Feed Reader).

Ladislav Hagara | Komentářů: 0

Node.js 22

včera 04:55 | Nová verze

OpenJS Foundation, oficiální projekt konsorcia Linux Foundation, oznámila vydání verze 22 otevřeného multiplatformního prostředí pro vývoj a běh síťových aplikací napsaných v JavaScriptu Node.js (Wikipedie). V říjnu se verze 22 stane novou aktivní LTS verzí. Podpora je plánována do dubna 2027.

Ladislav Hagara | Komentářů: 0

Proxmox Virtual Environment 8.2

včera 04:22 | Nová verze

Byla vydána verze 8.2 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu. Zdůrazněn je průvodce migrací hostů z VMware ESXi do Proxmoxu.

Ladislav Hagara | Komentářů: 0

R 4.4.0 (Puppy Cup)

včera 04:11 | Nová verze

R (Wikipedie), programovací jazyk a prostředí určené pro statistickou analýzu dat a jejich grafické zobrazení, bylo vydáno ve verzi 4.4.0. Její kódové jméno je Puppy Cup.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

KDE Plasma 6

už používám (73%)

čekám, až se dostane do mé distibuce (9%)

čekám na pozdější vydání v řadě (2%)

preferuji jiné desktopové prostředí (16%)

Celkem 795 hlasů

Komentářů: 4, poslední 6.4. 15:51

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / multiline grep

Štítky: grep

Dotaz: multiline grep

30.4.2008 14:36 Terka | skóre: 13
multiline grep

Přečteno: 668×

Odpovědět | Admin

Mejme file kde zaznamy zacinaji "2008-" a jsou viceradkove. Chtela bych na nej provest grep tak aby mi zobrazil ne radky, ale zaznamy. Napsala jsem neco v Perlu, ale myslim, ze by to slo lepe. Muzete mi poradit?

re="4718|4717";
#main ######################################################
$/=undef;


while ($file=(<>)) # cteni z prikaz radky 
{
$a="\n".$file; #kvuli split \n2008
chop ($a);  #kvuli print "$pole[$i]\n"; - zbavim se posledniho znaku enter
@pole=split (/\n2008/,$a) ;
$delka_pole=@pole;

$i=1;
while ($delka_pole > $i)
{
    if ($pole[$i]=~/$re/)
    {
    $pridej ="2008" ;
    $pridej =$pridej.$pole[$i]."\n";
    $" = "";             #"########################### ok
    push (@vystup, $pridej);
    }
    $i++ ;
}
}

Nástroje: Začni sledovat (1) ?

Odpovědi

30.4.2008 16:00 rastos | skóre: 62 | blog: rastos
Rozbalit Rozbalit vše Re: multiline grep

Je počet riadkov v zázname fixný? Ak áno, tak "grep -A".

30.4.2008 16:37 Terka | skóre: 13
Rozbalit Rozbalit vše Re: multiline grep

neni, grep -A -B znam

30.4.2008 16:41 Jan Šimák | skóre: 37 | Hradec Králové
Rozbalit Rozbalit vše Re: multiline grep

Přesně jsem nepochopil tvůj dotaz :-(

ale pokud ti jde o počet úspěchů nalezení řetězce, tak by to šlo takto:

chomp (my @var = STDIN>);
my $times = grep (/se/m, @var);
print "$times\n";

30.4.2008 16:51 Terka | skóre: 13
Rozbalit Rozbalit vše Re: multiline grep

jde o grep ne na radky, ale na zaznamy. cili oddelovac neni \n ale ^2008.

30.4.2008 20:01 ams
Rozbalit Rozbalit vše Re: multiline grep

perl -0777 -e 'print map "2008$_", grep /4718|4717/, split/\n2008/, <>' soubor_s_daty.dat

30.4.2008 20:03 ams
Rozbalit Rozbalit vše Re: multiline grep

Pisu rychleji nez premyslim :). Toto bude lepsi:

perl -0777 -e 'print grep /4718|4717/, split/\n(?=2008)/, <>' soubor_s_daty.dat

30.4.2008 20:10 ams
Rozbalit Rozbalit vše Re: multiline grep

A jeste poznamka - kdybyste chtela nejakym zpusobem oznacit hranice zaznamu, pak je nejlepsi pouzit $,. Treba dat $,="\n####\n"; pred ten print.

1.5.2008 11:23 Terka | skóre: 13
Rozbalit Rozbalit vše Re: multiline grep

diky za odpoved, mohla bych Vas poprosit jeste o komentar? S Perlem zacinam, tudiz nechapu jak Vas program pracuje. T.

1.5.2008 11:59 Terka | skóre: 13
Rozbalit Rozbalit vše Re: multiline grep

me to za kazdym zaznamem tisklo \n, vam ho to netiskne.

1.5.2008 12:59 Terka | skóre: 13
Rozbalit Rozbalit vše Re: multiline grep

uz mi to tiskne = moje blbost $,

1.5.2008 13:09 Terka | skóre: 13
Rozbalit Rozbalit vše Re: multiline grep

tak to pomalu chapu
-0777 nacte data jako jeden zaznam
-e skript je v radce
(?=2008) si zapamatuje 2008 a do pole to da vcetne toho 2008 (nezahodi tuto cast oddelovace)
nechapu proc: 
1. jsou carky mezi prikazy (jde o oddelovac vice prikazu na radce?)
2. proc je poradi prikazu 1.print 2.split 3.<>
diky!

1.5.2008 13:17 Terka | skóre: 13
Rozbalit Rozbalit vše Re: multiline grep

muzete mi nekdo vysvetlit nasledujici:
time cat soubor|perl -0777 -e '$,="\n", print grep /40030/, split/\n(?=2008)/, <>'
real    0m1.137s
user    0m0.760s
sys     0m0.510s

time cat soubor|perl -0777 -e 'print grep /40030/, split/(?=\n2008)/, <>' 
real    0m8.116s
user    0m7.800s
sys     0m0.410s

2.5.2008 12:04 ams
Rozbalit Rozbalit vše Re: multiline grep

Opravdu zvlastni chovani. Provedla jste mereni casu vicekrat u obou verzi?

Co se tyce kodu, tak po $,="\n" bych radeji pouzil strednik misto carky i kdyz v tomto pripade je to celkem jedno. Carka obvykle neoddeluje prikazy (na to pouzivate strednik), ale zaznamy v seznamu anebo argumenty prikazu. Tento kod funguje takto:

1) $,="\n"; Vkladame \n mezi jednotlive polozky v print. Napr., print("a","b","c"); ted vytiskne "a\nb\nc".

2) Kdyz pridame zavorky, pak prikaz vypada nasledovne:

print(grep(/40030/, split(/(?=\n2008)/, <>)))

Takze to neni posloupnost prikazu, ale jsou to vlozene prikazy. Operator <> nacte cely soubor (protoze mame $/=undef v dusledku -0777). Provadime split na zaklade regexpu /(?=\n2008)/. Kdybychom pouzili jako oddelovac poli jenom /\n2008/, pak ztratili bychom tuto cast zaznamu (prave proto v mem prvnim reseni je map "2008$_", ktere vraci tuto cast zpatky). Kdyz pouzijeme look-ahead assertion (?=\n2008), pak vlastne provadime split v kazdem bode retezce, za kterym nasleduje \n2008, ale \n2008 neni brano jako soucast oddelovace poli. Vysledek splitu je seznam zaznamu, ktery je predavany jako druhy argument grepu. grep prochazi vsechny zaznamy tohoto seznamu a hleda jenom vyhovujici regexpu /40030/. Funguje nejak takto:

for $_ (seznam_zaznamu_ktery_vygeneroval_split) {
   if ( $_ =~ /40030/ ) {
       nechame_tento_zaznam_ve_vysledku;
   } else {
       zahodime_tento_zaznam;
   }
}

Nakonec, print vytiskne vsechny nalezene zaznamy a vlozi mezi ne $, (v nasem pripade prazdny radek).

2.5.2008 12:11 ams
Rozbalit Rozbalit vše Re: multiline grep

Mozna bude jednodussi si to zapsat jako nekolik prikazu:

$, = "\n";
$soubor = <>;
@vsechny_zaznamy = split(/(?=\n2008)/, $soubor);
@jenom_obsahujici_regexp = grep(/40030/, @vsechny_zaznamy);
print @jenom_obsahujici_regexp;

2.5.2008 12:26 Terka | skóre: 13
Rozbalit Rozbalit vše Re: multiline grep

ad 0) to mereni casu jsem delala nekolikrat.
ad 1) ted je mi to jasne - vlozene prikazy - proto carka a proto to poradi.
nakonec jsem tam jeste pridala sort (jako v mem puvodnim skriptu)
casove je to +- stejne (muj puvodni vs vas)

perl -0777 -e 'print sort grep /neco/, split/^(?=2008)/m, <>'
velike diky za vysvetleni!

2.5.2008 12:06 ams
Rozbalit Rozbalit vše Re: multiline grep

Mimochodem, misto cat soubor | perl -0777 -e '...' je lepsi pouzit perl -0777 -e '...' soubor

2.5.2008 12:19 Terka | skóre: 13
Rozbalit Rozbalit vše Re: multiline grep

jasne. vim ze to je zacatecnicka chyba. delam to casto, lip se mi to cte.

27.5.2008 07:33 jsk | skóre: 10
Rozbalit Rozbalit vše Re: multiline grep

Dobrý den,

obdobný problém řeším tak, že pomocí tr -d '\r\n' (pro dos) spojím vše do jednoho řádku a následně sed-em rozřežu, na např. pro grep, použitelné řádky, tj. z mého pohledu standardně/typově začínající nebo končící. Pokud mi pošlete vzorek s konkrétním popisem požadavku, mohu se na to zkusit podívat.

jsk

27.5.2008 13:52 Yokotashi
Rozbalit Rozbalit vše Re: multiline grep

Predpokladam, ze soubor nemuze obsahovat nejaky znak (nebo muze jenom v komentari, kde se da snadno odstranit bez jeho poskozeni). Dejme tomu, ze ten znak je # (lze pouzit jakykoliv).

Neni to moc hezke, ale funguje to spolehlive.

27.5.2008 17:57 ams
Rozbalit Rozbalit vše Re: multiline grep

Napad je dobry, ale v tomto provedeni nefunguje uplne tak jak je treba. U prvniho nalezeneho zaznamu bude chybet 2008 a naopak za poslednim zaznamem bude 2008 navic. V textovych souborech zpravidla chybi znak s ASCII-kodem 0, proto muzeme pouzit sed 's/^2008/\x002008/' soubor_s_daty.dat | grep -z 'co_hledame' | tr -d '\0', ale i tak je to 4-krat pomalejsi nez reseni v Perlu.

27.5.2008 18:04 ams
Rozbalit Rozbalit vše Re: multiline grep

Zase pisu rychleji nez premyslim :). Takhle to vypada lip (i kdyz funguje naproste stejne):

sed 's/^2008/\x00&/' soubor_s_daty.dat | grep -z 'co_hledame' | tr -d '\0'

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje