Portál AbcLinuxu, 10. května 2025 07:20

Dotaz: presun SEDem

30.3.2009 17:39 Buf
presun SEDem
Přečteno: 315×
Odpovědět | Admin

Dobrý den, potřeboval bych programem sed vytvořit ze souboru rodcislo.txt nový soubor vystup.txt, který bude mít následující formát:
Jmeno Prijmeni DD. MM. RRRR
Soubor rodcislo.txt obsahuje seznam rodných čísel a jmen osob ve formátu:
rrmmdd/nnn...:Jmeno Prijmeni


Problém je v tom, že sedem umím jen nahrazovat a nebo vymazávat různé řetězce :

sed 's/[0-9]\{6\}\/[0-9]\{3,5\}/CUC/' rodcislo.txt
- místo rod. čísla napíše CUC


Jenže nevím jak to "přesunout". Poradí mi pls někdo?

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

30.3.2009 17:58 Vojtěch Horký | skóre: 39 | blog: Vojtův zápisník | Praha
Rozbalit Rozbalit vše Re: presun SEDem
Odpovědět | | Sbalit | Link | Blokovat | Admin
sed 's/\([0-9][0-9]\)\([0-9][0-9]\)\([0-9][0-9]\)\(/[0-9]\{3,5\}\)/\1.\2.RR\3 (\4)/
Ha, snad jsem někde nezapomněl nějaký backslash...
I am always ready to learn although I do not always like to be taught. (W. Churchill)
30.3.2009 18:04 l4m4
Rozbalit Rozbalit vše Re: presun SEDem
Důležité asi je, že co se strčí ve vzoru do skupiny \(...\), na to se lze v nahrazení postupně odkazovat \1, \2, \3, ..., čímž je možno věci libovolně prohazovat.

Stejně je to zase nějaký domácí úkol.
30.3.2009 18:39 Buf
Rozbalit Rozbalit vše Re: presun SEDem
Odpovědět | | Sbalit | Link | Blokovat | Admin

Tak sem to vyresil (az na jednu drobnost : zeny maj u mesicu +5, coz nevim co s tim). Sice ten vas prikaz nebyl dobre, ale hodne moc mi pomohl. Děkuju vam obema...

30.3.2009 18:44 Vojtěch Horký | skóre: 39 | blog: Vojtův zápisník | Praha
Rozbalit Rozbalit vše Re: presun SEDem
zeny maj u mesicu +5, coz nevim co s tim
Zkuste použít AWK (funkce gensub umí to, co s/.../.../) - ten zvládá i jednoduchou aritmetiku.
I am always ready to learn although I do not always like to be taught. (W. Churchill)
1.4.2009 02:09 Ondřej Kubečka | skóre: 29 | blog: datlovo | Ulm
Rozbalit Rozbalit vše Re: presun SEDem
Ano, tohle dělá úlohu zajímavou... ale protože domácí úkoly by člověk měl řešit sám, aby se něco naučil, tak jenom postrčím (předpokládám, že to bude muset bát v sedu). Předpokládám, že cest bude více, tuto jsem naimplementovla a funguje:

Zpracovávaný řádek si schovejte, abyste mohl zkusit záměnu na ženské/mužské RČ (nezapomeňte si ho ve správnou chvíli načíst zpět). Podle výsledku provedete podmíněný skok a u ženského RČ nahradíte první číslici měsíce... pak už je to jenom rozřazení regulérním výrazem, jak ho popisovali lidé zde a v dalším vlákně s pár dodatky:

a) ty počty výskytů ve složených závorkách nejsou regexp, ale eregexp... což Vám může být jedno s gsedem na Linuxu, ale může Vás zaskočit na nějakém UNIXovém systému (třeba Solarisu). b) Když je v něčem hromada dopředných a zpětných uvozovek, tak bych se moc přimlouval za jiný oddělovač (což snad podporuje každá implementace sedu), neb to usnadní čtení. Třeba '#' (to se hezky liší od těch lomítek).

Kromě toho, že RČ rozlišuje pohlaví tam je ještě jeden zádrhel. Předpokládat ročník 19xx je podle mě chyba. Dobrá zpráva je, že formátování let lze vyřešit velmi podobně jako to pohlaví, akorát se to ještě trošičku zkomplikuje.

Zdar při řešení!
1.4.2009 02:21 Ondřej Kubečka | skóre: 29 | blog: datlovo | Ulm
Rozbalit Rozbalit vše Re: presun SEDem
Mea culpa... sypu si popel na hlavu. Počet výskytů ve "složenkách" samozřejmě regexp je a vesele ho můžete v sedu požívat i mimo svět gnutilit. Regexp nezná počty pomocí + a ?. Omlouvám se sedu i těm, kteří tuto konstrukci správně použili.

Tento zápis naopak nefunguje v eregexpu, takže v awku a egrepu si s nimi neškrtnete (nemluvím o gnu, kde je to vesměs jedno). Ke škodě přehlednosti a jednoduchosti psaní regulérních výrazů jsem si zvykl být docela hodně polopatický, abych neronil krokodýlí slzy tu nad nawkem, to nad sedem.
1.4.2009 02:53 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: presun SEDem
Tento zápis naopak nefunguje v eregexpu

Funguje, jen se v RE ty složené (a kulaté) závorky na rozdíl od BRE nebackslashují.

1.4.2009 11:18 Ondřej Kubečka | skóre: 29 | blog: datlovo | Ulm
Rozbalit Rozbalit vše Re: presun SEDem
Jste si jistý? Kvalifikoval jsem to tím, že se nebavím o gnutilitách:
$  echo "0123
012345
0123456" | grep '^[0-9]\{6\}$'
012345

$ echo "0123
012345
0123456" | egrep '^[0-9]{6}$'
Případně k tomu sedu:
echo "0123
012345
0123456" | sed -ne '/^[0-9]\{6\}$/p'
012345

echo "0123
012345
0123456" | awk '/^[0-9]{6}$/{print}'
Ostatně i manuálová stránka egrep(1) to říká:
     The /usr/bin/egrep utility accepts full regular  expressions
     as described on the regexp(5) manual page, except for \( and
     \), \( and \), \{ and \}, \< and \>, and \n,  and  with  the
     addition of:
...
     4.  A full  regular  expression  that  may  be  enclosed  in
         parentheses ()for grouping.
Tj. vrací se nám pouze závorky, ne složené. Váše uvedený příklad je Solaris 10.

A protože ne jen Linuxem a gnu nástroji je živ člověk, tak jsem tam napsal to upozornění. ;) Lidi se pak někdy nestačí divit, když zasednou před něco s UNIXem.
1.4.2009 12:19 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: presun SEDem
Já ale mluvil o tom, jestli je konstrukce se složenými závorkami součástí syntaxe rozšířených regulárních výrazů, ne o tom, jestli nějaká konkrétní implementace egrep nebo awk podporuje rozšířené regulární výrazy úplně nebo jen částečně. Takže vámi citovaný odstavec vlastně potvrzuje moje slova.
1.4.2009 02:46 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: presun SEDem
Odpovědět | | Sbalit | Link | Blokovat | Admin

To už je zase čas zápočtů?

P.S.: doporučuji zvyknout si na to, že sed a SED jsou dva různé příkazy…

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.