Portál AbcLinuxu, 11. května 2025 06:43

Dotaz: Sed - odstranění rozdělovníku a spojení slov

17.4.2015 21:54 tonda | skóre: 8
Sed - odstranění rozdělovníku a spojení slov
Přečteno: 321×
Odpovědět | Admin
Ahoj. Snažím se pomocí sedu upravit text, který byl z pdf souboru převeden do txt. Částečně jsem ho upravil, ale teď nemohu přijít na to jak odstranit rozdělovací čárku a spojit slova. Uvádím pár částí vět které vznikly po úpravě.

"bylo vidi- telné minimálně... nebo spádovištní- ho návěstidla... technických no- rem a v souladu se..."

Vím, že to lze řešit tímto "klasickým" postupem kdy vypíšu všechny písmena.
 sed 's/i- /i/' text_soubor.txt 
 sed 's/í- /í/' text_soubor.txt
A právě pro tu pracnost se chci zeptat jak použít funkci /([a-z]) /\1/ nebo cokoli jiného, co by mi načetlo jakékoli písmeno za kterým je rozdělovník s mezerou a poté mi to písmeno napsalo bez rozdělovníku. Není nutné použít sed, znáte-li řešení v jiném progr. jazyku awk, perl atd. budu Vám vděčný i za toto řešení. Předem děkuji Tonda

Řešení dotazu:


Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

Řešení 2× (mimi.vx, tonda (tazatel))
Fuky avatar 17.4.2015 22:20 Fuky | skóre: 52 | blog: 4u
Rozbalit Rozbalit vše Re: Sed - odstranění rozdělovníku a spojení slov
Odpovědět | | Sbalit | Link | Blokovat | Admin
$ sed 's/\([a-z]\)- /\1/g' filename.txt
bylo viditelné minimálně... nebo spádovištního návěstidla... technických norem a v souladu se...
-- RÁMO: psí tábor , ETriatlon: Výuka plavání
17.4.2015 22:43 tonda | skóre: 8
Rozbalit Rozbalit vše Re: Sed - odstranění rozdělovníku a spojení slov
Mockrát děkuji, funguje báječně. Celou tu dobu jsem dělal chybu v tom, že jsem pomlčku umisťoval za hranatou závorku: \([a-z]- \)

Díky Tonda
Řešení 1× (mimi.vx)
18.4.2015 15:53 mimi.vx | skóre: 37 | blog: Mimi.VX | Praha
Rozbalit Rozbalit vše Re: Sed - odstranění rozdělovníku a spojení slov

$ sed -r 's/([a-z])- /\1/g'

USE="-gnome -kde";turris

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.