Portál AbcLinuxu, 6. května 2025 04:17

Dotaz: bash - hromadna uprava textu

tomes.io avatar 17.7.2012 12:22 tomes.io | skóre: 12 | blog: tomesh
bash - hromadna uprava textu
Přečteno: 492×
Odpovědět | Admin
Ahoj,

uz je to nejaky cas co jsem delal s regularnimi vyrazy.

Mohl by mi nekdo poradit, jak co nejlepe dostat text, ktery je napsan na nekolik radku, mezi tagy, na jeden radek?

Priklad vychoziho textu:
<> aaasasdaasfddsfsdf <+>
<> aaasasdaasfddsfsdf <+>

<> aaasasdaasfdd
sdsdsdsd
sdsdsdsdsd
sdsdsdsdsdsfsdf <+>
Vyslednu text bych chtel v teto podobe:
<> aaasasdaasfddsfsdf <+>
<> aaasasdaasfddsfsdf <+>

<> aaasasdaasfddsdsdsdsdsdsdsdsdsdsdsdsdsdsdsfsdf <+>

Tedy, potrebuji takovu regularni vyraz, ktery by jednotlive vety mezi tagy a dal do jednoho radku. Potrebuji takto upravit hromadu textu pro snazsi kontrolu v diffu (bude snazsi nachazet a oznacovat chybne radky).

Budu rad, pokud mi nekdo poradi prislusny regularni vyraz v sed nebo prikaz v awk.

Vim, jak v awk odstranit vsechny znaky newline, ale mezi tagy mi to nejde. Zatim jsem v awk dospel k tomuto prikazu (ktery ale nedela pozadovane). Mozna by ho stacilo jen nejak lehce upravit?
cat text1 | awk 'BEGIN{RS="<+>"}{printf "%s", $0}'

Řešení dotazu:


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

17.7.2012 13:12 iKoulee | skóre: 19
Rozbalit Rozbalit vše Re: bash - hromadna uprava textu
Odpovědět | | Sbalit | Link | Blokovat | Admin
nesnazil bych se odstranovat jen nektere znaky noveho radku, ale odstranil bych vsechny a pak pridal nove, tam kam potrebuji, treba nejak takhle:

sed -e ':a;N;$!ba;s/\n//g' -e 's/\(<+>\)/\1\n/g'
Even if you fall on your face, you’re still moving forward
tomes.io avatar 17.7.2012 15:54 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: bash - hromadna uprava textu
Diky moc, to je presne co jsem potreboval. Akorat bych jeste poprosil o upravu pro klasicky tagovy format sipky se zpetnym lomitkem

</s>

POkud tento tag pouziju misto <+> tak mi bash vyhodi hlasku:
sed: -e expression #2, char 12: unknown option to `s'
Hadam, ze se v regularnim vyrazu musi nejak vyjadrit, ze tag neni specialni znacka pro vyraz, nejak to odblokovat. Zkousel jsem to ruzne obehnat zpetnyma lomitkama, ale furt to nejde.
17.7.2012 16:36 iKoulee | skóre: 19
Rozbalit Rozbalit vše Re: bash - hromadna uprava textu
imo je to lomitko v tagu normalni a jedinne co potrebujete vyescapovat je prave to lomitko a to zpetnym lomitkem :-)
sed -e ':a;N;$!ba;s/\n//g' -e 's/\(<\/s>\)/\1\n/g'
Even if you fall on your face, you’re still moving forward
tomes.io avatar 18.7.2012 08:23 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: bash - hromadna uprava textu
Diky, tohle tak nejak splnilo co jsem potreboval :)
tomes.io avatar 18.7.2012 09:17 tomes.io | skóre: 12 | blog: tomesh
Rozbalit Rozbalit vše Re: bash - hromadna uprava textu
Jeste by tu bylo jedno reseni s awk:
cat out.txt |awk 'BEGIN{tmp=""} $0 ~ /.*<\/s>.*/{print tmp $0;tmp="";} $0 !~ /.*<\/s>.*/{tmp=tmp $0}'
xkucf03 avatar 17.7.2012 22:55 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: bash - hromadna uprava textu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Pokud ti jde o porovnávání, tak doporučuji načíst jako DOM a pak zase serializovat (uložit jako XML) s tím, že se to uloží stejným způsobem. Případně to můžeš prohnat přes normalize-space() v XSLT.

Nebo použít rovnou nějaký nástroj na porovnávání XML.

A ještě pozor na to odstraňování mezer – z těch konců řádků by se měly stát mezery, neměly by úplně zmizet.
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.