Portál AbcLinuxu, 11. května 2025 07:07

Dotaz: regulární výraz

2.1.2009 16:23 Kit
regulární výraz
Přečteno: 490×
Odpovědět | Admin

Jde jen o příklad, ale potreboval bych z tohodle:

ABC M N NM A AB AC BC BA  CA CB MN ABC M BC BA  CA CB N NM A AB MN

dostat toto: ABC_MN ABC_MN

 

Došel jsem k tomuto:

echo ABC M N NM A AB AC BC BA  CA CB MN ABC M BC BA  CA CB N NM A AB MN | \

sed 's/ABC\([^M][^N]\)\+MN/ABC_MN/g'

ale nefunguje to...

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

2.1.2009 16:46 fakenickname | skóre: 42 | blog: fakeblog
Rozbalit Rozbalit vše Re: regulární výraz
Odpovědět | | Sbalit | Link | Blokovat | Admin
a co je presne to ABC, N a M? Znaky? Stringy? Cisla? Cela cisla? Realna cisla? ...
2.1.2009 16:50 Filip Jirsák | skóre: 68 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: regulární výraz
Odpovědět | | Sbalit | Link | Blokovat | Admin
V tom vašem výrazu hledáte všechny výskyty ABC…MN, mezi kterými je alespoň jedna dvojice písmen, přičemž v té dvojici vždy první písmeno nesmí být M a druhé N. Takže třeba pokud bude mezi ABC a MN lichý počet znaků, nebude vám to fungovat. Zkuste místo toho \([^M][^N]\)\+ použít .\+? – pokud tuhle konstrukci váš sed umí. +? je v Perl-like syntaxy „ne-nenasytný“ (ungreedy) operátor, tj. „spolkne“ co nejméně znaků.

Ale možná by nebylo od věci popsat, co chcete udělat doopravdy, možná bude existovat nějaké plně jiné jednoduché řešení. Ten váš příklad totiž nedává žádný smysl.
2.1.2009 17:08 vb
Rozbalit Rozbalit vše Re: regulární výraz
Odpovědět | | Sbalit | Link | Blokovat | Admin

A nešlo by to větším kladivem?

echo ABC M N NM A AB AC BC BA  CA CB MN ABC M BC BA  CA CB N NM A AB MN | perl -pe 's/ABC.+?NM/ABC_NM/g;'

dává

ABC_NM A AB AC BC BA CA CB MN ABC_NM A AB MN
2.1.2009 17:57 MalyZelenyHnus | Praha
Rozbalit Rozbalit vše Re: regulární výraz
Odpovědět | | Sbalit | Link | Blokovat | Admin

A co takhle?

Prepinac -r pro sed tam je pro pouziti rozsirenych reg. vyrazu. Bez nej to neprojde.

 

echo "ABC M N NM A AB AC BC BA  CA CB MN ABC M BC BA  CA CB N NM A AB MN" |  sed -r 's/ABC(M[^MN]|[^M])*MM*N/ABC_MN/g'

Didaktik M - brána do světa profesionálních počítačů
2.1.2009 19:15 Kit
Rozbalit Rozbalit vše Re: regulární výraz
Odpovědět | | Sbalit | Link | Blokovat | Admin

Děkuji vsem za reakce...

Mě jde o to jake pomocí regulárního výrazu udělat něco jako [^ ] pronekolik znaků, tedy aby se například nemohlo v textu vyskytnout ABC ale mohlo A AB BC AC...

Něco jako [^\(ABC\)]

toto:  echo ABC M N NM A AB AC BC BA  CA CB MN ABC M BC BA  CA CB N NM A AB MN | perl -pe 's/ABC.+?NM/ABC_NM/g;'

je přesnš to co hledám...

Díky moc

Jenom pro zajímavost... Jak by se to udělalo bez tech Perl-like vychytávek?

2.1.2009 21:14 Cestmir Houska
Rozbalit Rozbalit vše Re: regulární výraz

S tou negaci toho ABC, neslo by to takhle?: ([^A][^\ ]*)|(A^B[^\ ]*)|(AB^C[^\ ]*)
Nevim, jestli mam spravne syntaxi, protoze je to uz chvilka, co jsem si naposledy nejak poradne s regexpy hral, ale jde zhruba o to, ze bud bereme slova, ktera zacinaji na cokoliv jineho nez A, nebo (kdyz uz na A zacinaji) alespon nemaji na druhem miste B a nebo na tretim C.

2.1.2009 22:05 fakenickname | skóre: 42 | blog: fakeblog
Rozbalit Rozbalit vše Re: regulární výraz
sice nejsem odbornik ale tohle musi dany engine pro regularni vyrazy velice tesit (zvlast pokud je to ten co testuje vsecko i kdyz najde driv, neni to posix dfa nebo tak neco?)
2.1.2009 22:52 Cestmir Houska
Rozbalit Rozbalit vše Re: regulární výraz

Hmm, tak odbornik taky nejsem, ale ve skole jsme se ucili, jak jdou regularni vyrazy prevadet na konecne automaty a verim, ze to nejak podobne spousta enginu i dela. Slozitost toho prevodu je myslim i linearni, ale moc se mi nad tim ted premyslet nechce :) Takze na ten regexp, co jsem predtim napsal, by stacily tri konecne automaty, ktere by to prochazelo paralelne a navic, kdyz by to v jednom z nich prestalo odpovidat, tak se muze cela ta jedna vetev prestat resit (neco jako zkracene vyhodnocovani logickych operaci). Fakt nevim, jak jsou ty enginy delany, ale verim, ze s timhle by nemely nejmensi problem.

3.1.2009 03:39 fakenickname | skóre: 42 | blog: fakeblog
Rozbalit Rozbalit vše Re: regulární výraz
No co sem se dozvedel ze cteni knizky "Mastering regular expressions, Jefrey Friedl", tak pokud se vam podari pouzit dostatecny pocet hvezdicek (nekdy staci i dve) a mate trochu sikovne ruce, tak bezproblemu vytvorite regex, ktery na nekterych enginech (myslim ze sed zrovna ano) muze probihat treba i nekolik milionu let .. Myslim, ze regex o kterem se bavime neni jeden z nejefektivnejsich. Ale co, vem to cert. Kdyz to dobehne rychleji nez by to delal clovek tak je to ok..
3.1.2009 19:52 Ladicek | skóre: 28 | blog: variace | Havlíčkův brod
Rozbalit Rozbalit vše Re: regulární výraz
Problém s regulárními výrazy v Perlu, sedu a všem možném je ten, že nejde o regulární výrazy ve smyslu teorie formálních jazyků :-) Jak v téhle diskusi nevím, ty regexpy jsem nezkoumal :-)
Ještě na tom nejsem tak špatně, abych četl Viewegha.
3.1.2009 09:28 happy barney | skóre: 34 | blog: dont_worry_be_happy
Rozbalit Rozbalit vše Re: regulární výraz
v dokumentacii hladajte vyraz "negative lookahead".
vacsie kladivo (perl) to zvlada takto m/A(?!BC)/
6.1.2009 11:56 ams
Rozbalit Rozbalit vše Re: regulární výraz

Na urovni POSIX-regexpu tento ukol neni jednoduchy.

 

echo ABC M N NM A AB AC BC BA  CA CB MN ABC M BC BA  CA CB N NM A AB MN | sed 's/ABC\(AB[^C]\|A[^B]\|[^A]\)\+MN/ABC_MN/g'

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.