regulární výraz

V tom vašem výrazu hledáte všechny výskyty ABC…MN, mezi kterými je alespoň jedna dvojice písmen, přičemž v té dvojici vždy první písmeno nesmí být M a druhé N. Takže třeba pokud bude mezi ABC a MN lichý počet znaků, nebude vám to fungovat. Zkuste místo toho \([^M][^N]\)\+ použít .\+? – pokud tuhle konstrukci váš sed umí. +? je v Perl-like syntaxy „ne-nenasytný“ (ungreedy) operátor, tj. „spolkne“ co nejméně znaků.

Ale možná by nebylo od věci popsat, co chcete udělat doopravdy, možná bude existovat nějaké plně jiné jednoduché řešení. Ten váš příklad totiž nedává žádný smysl.

Děkuji vsem za reakce...

Mě jde o to jake pomocí regulárního výrazu udělat něco jako [^ ] pronekolik znaků, tedy aby se například nemohlo v textu vyskytnout ABC ale mohlo A AB BC AC...

Něco jako [^\(ABC\)]

toto: echo ABC M N NM A AB AC BC BA CA CB MN ABC M BC BA CA CB N NM A AB MN | perl -pe 's/ABC.+?NM/ABC_NM/g;'

je přesnš to co hledám...

Díky moc

Jenom pro zajímavost... Jak by se to udělalo bez tech Perl-like vychytávek?

2.1.2009 21:14 Cestmir Houska
Rozbalit Rozbalit vše Re: regulární výraz

S tou negaci toho ABC, neslo by to takhle?: ([^A][^\ ]*)|(A^B[^\ ]*)|(AB^C[^\ ]*)
Nevim, jestli mam spravne syntaxi, protoze je to uz chvilka, co jsem si naposledy nejak poradne s regexpy hral, ale jde zhruba o to, ze bud bereme slova, ktera zacinaji na cokoliv jineho nez A, nebo (kdyz uz na A zacinaji) alespon nemaji na druhem miste B a nebo na tretim C.

2.1.2009 22:05 fakenickname | skóre: 42 | blog: fakeblog
Rozbalit Rozbalit vše Re: regulární výraz

sice nejsem odbornik ale tohle musi dany engine pro regularni vyrazy velice tesit (zvlast pokud je to ten co testuje vsecko i kdyz najde driv, neni to posix dfa nebo tak neco?)

2.1.2009 22:52 Cestmir Houska
Rozbalit Rozbalit vše Re: regulární výraz

Hmm, tak odbornik taky nejsem, ale ve skole jsme se ucili, jak jdou regularni vyrazy prevadet na konecne automaty a verim, ze to nejak podobne spousta enginu i dela. Slozitost toho prevodu je myslim i linearni, ale moc se mi nad tim ted premyslet nechce :) Takze na ten regexp, co jsem predtim napsal, by stacily tri konecne automaty, ktere by to prochazelo paralelne a navic, kdyz by to v jednom z nich prestalo odpovidat, tak se muze cela ta jedna vetev prestat resit (neco jako zkracene vyhodnocovani logickych operaci). Fakt nevim, jak jsou ty enginy delany, ale verim, ze s timhle by nemely nejmensi problem.

3.1.2009 03:39 fakenickname | skóre: 42 | blog: fakeblog
Rozbalit Rozbalit vše Re: regulární výraz

No co sem se dozvedel ze cteni knizky "Mastering regular expressions, Jefrey Friedl", tak pokud se vam podari pouzit dostatecny pocet hvezdicek (nekdy staci i dve) a mate trochu sikovne ruce, tak bezproblemu vytvorite regex, ktery na nekterych enginech (myslim ze sed zrovna ano) muze probihat treba i nekolik milionu let .. Myslim, ze regex o kterem se bavime neni jeden z nejefektivnejsich. Ale co, vem to cert. Kdyz to dobehne rychleji nez by to delal clovek tak je to ok..

3.1.2009 19:52 Ladicek | skóre: 28 | blog: variace | Havlíčkův brod
Rozbalit Rozbalit vše Re: regulární výraz

Problém s regulárními výrazy v Perlu, sedu a všem možném je ten, že nejde o regulární výrazy ve smyslu teorie formálních jazyků :-)

Jak v téhle diskusi nevím, ty regexpy jsem nezkoumal :-)

Ještě na tom nejsem tak špatně, abych četl Viewegha.

3.1.2009 09:28 happy barney | skóre: 34 | blog: dont_worry_be_happy
Rozbalit Rozbalit vše Re: regulární výraz

v dokumentacii hladajte vyraz "negative lookahead".
vacsie kladivo (perl) to zvlada takto m/A(?!BC)/

6.1.2009 11:56 ams
Rozbalit Rozbalit vše Re: regulární výraz

Na urovni POSIX-regexpu tento ukol neni jednoduchy.

echo ABC M N NM A AB AC BC BA CA CB MN ABC M BC BA CA CB N NM A AB MN | sed 's/ABC\(AB[^C]\|A[^B]\|[^A]\)\+MN/ABC_MN/g'

Dotaz: regulární výraz

Odpovědi