regulární výraz v sedu

Gratuluji, získal jsi cenu ;-)

Jinak řešení je (nechápu odeskly prvni ani druhy, takže se držím zadání vypsat věc v prvních uvozovkách):

sed '/identifikator/s/[^"]*"\([^"]*\)".*/\1/;t;d' soubor

25.2.2005 00:47 Pavel Dobeš | skóre: 21 | Praha
Rozbalit Rozbalit vše Re: regulární výraz v sedu

Diky ;)

Ja nevim k cemu vlastne ten prikaz cat je... kdyz se nesmi pouzivat. Muzu vedet nejaky lepsi (kratsi), ktery vypise sobor na st. vystup a kazdemu je hned jasne, co dela? Popravde receno misto toho cat tam bude vystup z programu. Takze jsem moc nepremyslel, jak to napsat bez cat, kdyz ten cat vlastne v konecnem dusletku nepouziju. A kdyz neco zkousim, tak je mi prijemejsi na zacatek hodit cat a nedavat na konec prizkazu < ./soubor, protoze ho potom zbytecne preskakuju...

Ja znam regex hlavne z php a to mnohdy jinde nefunguje ;( A tady by me to pouziti ;t;d nenapadlo (se sedem si ani moc nevykam, natoz tykat). A sed v praktickych prikladech... to jsem taky nikde moc nevidel...

Jeste se zeptam... Jde udelat takove reseni i pomoci (g)awk? Ja vim, kdyz uz mam reseni pomoci sedu, proc chci zkouset i awk, ale neda mi to...

A k tomu reg. vyrazu: me by zajimalo, jestli jde nejak formulovat ^[^abc]*\$ ale pro 'abc'? Protoze bez negace to je jednoduche... ^.*abc.*\$... ale jak udelat doplnkovy reg. vyraz, to netusim...

Diky PaD

Windows? A kdo to ještě používá ?

25.2.2005 00:51 Pavel Dobeš | skóre: 21 | Praha
Rozbalit Rozbalit vše Re: regulární výraz v sedu

jj, s tim cat to je dobry... uz jsem se zacetl ;)

Windows? A kdo to ještě používá ?

25.2.2005 00:55 VícNežNic | skóre: 42 | blog: Spáleniště | Ne dost daleko
Rozbalit Rozbalit vše Re: regulární výraz v sedu

Když to nikomu neřekneš, tak si můžeš grepovat a catovat jak chceš, věř mi ;-)

Copak toho není dost?

25.2.2005 01:06 Pavel Dobeš | skóre: 21 | Praha
Rozbalit Rozbalit vše Re: regulární výraz v sedu

Ja vim, ze pustit sest ruznych programu v kolone je vlastne filosofie unixu (na vsechno mit jednoucelovou utilitu). Ale ono to zpomaluje. A on je i jeden grep navic poznat ;)

PaD

Windows? A kdo to ještě používá ?

25.2.2005 09:08 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: regulární výraz v sedu

No jestli chceš v sedu něco dělat s řádky, které neobsahují na řádku nikde abc, tak se to dělá /abc/!<akce>. Uvnitř reguláru je to obtížnější a řeší se to vypsáním všech možností co tam mohou být, což je pěkná pruda. Vždy je lepší se zamyslet jestli je to skutečně nutné a jestli to náhodou nejde obejít. Jinak ve vimu, grepu a snad i další exituje něco jako negativní hledání.

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

25.2.2005 09:38 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: regulární výraz v sedu

Příklad reguláru, který nikdy nenamatchuje abc je třeba $[^a]\|a[^b]\|ab[^c]$

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

25.2.2005 10:47 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: regulární výraz v sedu

Negativní matchování je feature PCRE, tudíž ho umí všechno, co umí PRCE, např. perl, grep, php. Kromě toho mají vim a python vlastní negativní matchování (s jinou syntaxí).

25.2.2005 11:13 Michal Marek (twofish) | skóre: 55 | blog: { display: blog; } | Praha
Rozbalit Rozbalit vše Re: regulární výraz v sedu

Tohle matchuje mj. všechno, co obsahuje znak různý od a, takže třeba abc ;-)

U klasických nebo rozšířených regexpů bych to řešil hrubou silou -- nakreslit si konečný automat a z něj vytvořit ten regexp.

26.2.2005 09:39 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: regulární výraz v sedu

Prdlačky švagrová. Namatchuje bc, ale nikdy ne abc. Samozřejmě to musíš použít uvnitř nějakého reguláru, třeba chci najít = za nímž nenásleduje abc a nahradit ho středníkem, s/=$[^a]\|a[^b]\|ab[^c]$/;\1/. Nebo chci nahradit = před nímž nesmí být abc /$[^c]\|[^b]c\|[^a]bc$=/\1;/. Zkrátka použít něco se silnějším regexpem je IMHO lepší.

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

26.2.2005 12:54 twofish
Rozbalit Rozbalit vše Re: regulární výraz v sedu

třeba chci najít = za nímž nenásleduje abc a nahradit ho středníkem, s/=$[^a]\|a[^b]\|ab[^c]$/;\1/

I to je spatne, protoze to nenahradi = na konci vstupu (radky), ale to je detail. Pavel Dobes se totiz ptal na doplnek k ^.*abc.*$, napr jako soucast vyrazu matchujiciho rovnitko nasledovane posloupnosti znaku neobsahujici abc.

^=(|c|bc)([^a]|a[^b]|ab[^c])*$

Pro jednoduchost to je v rozsirenych regularnich vyrazech a predpokladam jedno rovnitko ve vstupu (jinak se do [^ prida rovnitko, pripadne se ty znaky urci jeste restriktivneji /jenom pismena apod/). ^ a $ se nahradi za predchazejici / nasledujici regularni vyraz, pokud to ma byt soucasti nejakeho vetsiho regularniho vyrazu.

Dotaz: regulární výraz v sedu

Odpovědi