abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
včera 22:00 | Komunita

Přibližně před měsícem bylo oznámeno, že linuxová distribuce SUSE Linux Enterprise Server (SLES) běží nově také Raspberry Pi 3 (dokumentace). Obraz verze 12 SP2 pro Raspberry Pi 3 je ke stažení zdarma. Pro registrované jsou po dobu jednoho roku zdarma také aktualizace. Dnes bylo oznámeno, že pro Raspberry Pi 3 je k dispozici také nové openSUSE Leap 42.2 (zprávička). K dispozici je hned několik obrazů.

Ladislav Hagara | Komentářů: 2
včera 06:00 | Zajímavý software

OMG! Ubuntu! představuje emulátor terminálu Hyper (GitHub) postavený na webových technologiích (HTML, CSS a JavaScript). V diskusi k článku je zmíněn podobný emulátor terminálu Black Screen. Hyper i Black Screen používají framework Electron, stejně jako editor Atom nebo vývojové prostředí Visual Studio Code.

Ladislav Hagara | Komentářů: 29
včera 06:00 | Zajímavý článek

I letos vychází řada ajťáckých adventních kalendářů. QEMU Advent Calendar 2016 přináší každý den nový obraz disku pro QEMU. Programátoři se mohou potrápit při řešení úloh z kalendáře Advent of Code 2016. Kalendáře Perl Advent Calendar 2016 a Perl 6 Advent Calendar přinášejí každý den zajímavé informace o programovacím jazyce Perl. Stranou nezůstává ani programovací jazyk Go.

Ladislav Hagara | Komentářů: 8
3.12. 16:24 | Nová verze

Byla vydána Mageia 5.1. Jedná se o první opravné vydání verze 5, jež vyšla v červnu loňského roku (zprávička). Uživatelům verze 5 nepřináší opravné vydání nic nového, samozřejmě pokud pravidelně aktualizují. Vydání obsahuje všechny aktualizace za posledního téměř půldruhého roku. Mageia 5.1 obsahuje LibreOffice 4.4.7, Linux 4.4.32, KDE4 4.14.5 nebo GNOME 3.14.3.

Ladislav Hagara | Komentářů: 14
3.12. 13:42 | Pozvánky

V Praze probíhá konference Internet a Technologie 16.2, volné pokračování jarní konference sdružení CZ.NIC. Konferenci lze sledovat online na YouTube. K dispozici je také archiv předchozích konferencí.

Ladislav Hagara | Komentářů: 0
2.12. 22:44 | Komunita

Joinup informuje, že Mnichov používá open source groupware Kolab. V srpnu byl dokončen dvouletý přechod na toto řešení. V provozu je asi 60 000 poštovních schránek. Nejenom Kolabu se věnoval Georg Greve ve své přednášce Open Source: the future for the European institutions (SlideShare) na konferenci DIGITEC 2016, jež proběhla v úterý 29. listopadu v Bruselu. Videozáznam přednášek z hlavního sálu je ke zhlédnutí na Livestreamu.

Ladislav Hagara | Komentářů: 25
2.12. 15:30 | Zajímavý projekt

Společnost Jolla oznámila v příspěvku Case study: Sailfish Watch na svém blogu, že naportovala Sailfish OS na chytré hodinky. Využila a inspirovala se otevřeným operačním systémem pro chytré hodinky AsteroidOS. Použita je knihovna libhybris. Ukázka ovládání hodinek na YouTube.

Ladislav Hagara | Komentářů: 16
2.12. 14:15 | Nová verze

Byla vydána verze 7.1.0 skriptovacího jazyka PHP používaného zejména k vývoji dynamických webových stránek. Jedná se o první stabilní verzi nejnovější větvě 7.1. Přehled novinek v dokumentaci. Podrobnosti v ChangeLogu. K dispozici je také příručka pro přechod z PHP 7.0.x na PHP 7.1.x.

Ladislav Hagara | Komentářů: 5
2.12. 12:55 | Nová verze

Google Chrome 55 byl prohlášen za stabilní. Nejnovější stabilní verze 55.0.2883.75 tohoto webového prohlížeče přináší řadu oprav a vylepšení (YouTube). Opraveno bylo také 36 bezpečnostních chyb. Mariusz Mlynski si například vydělal 22 500 dolarů za 3 nahlášené chyby (Universal XSS in Blink).

Ladislav Hagara | Komentářů: 4
2.12. 11:55 | Pozvánky

Máte rádi svobodný software a hardware nebo se o nich chcete něco dozvědět? Přijďte na 135. sraz spolku OpenAlt, který se bude konat ve čtvrtek 8. prosince od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Sraz bude tentokrát tématický. Bude retro! K vidění budou přístroje jako Psion 5mx nebo Palm Z22. Ze svobodného hardwaru pak Openmoko nebo čtečka WikiReader. Přijďte se i vy pochlubit svými legendami, nebo alespoň na pivo. Moderní hardware má vstup samozřejmě také povolen.

xkucf03 | Komentářů: 1
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (24%)
 (29%)
 (7%)
 (5%)
 (3%)
Celkem 774 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama

Dotaz: Rozddělit soubor pomocí sed/awk/grep

17.1.2011 20:50 jeleniste | skóre: 13 | blog: Prokustovo lože
Rozddělit soubor pomocí sed/awk/grep
Přečteno: 385×
Je to asi snadná věc, měl bych bejt schopnej to vylaborovat sám. Ale ani s awkem, ani se sedem sem za tim nedělal, no, za optání nic nedám.
M8m soubor (kterej reprezentuje obsah databáze, jsou to vypsaný řádky tabulek). Formát je následující:
&nazev_tabulky;prvni_polozka;druha_polozka;..;.....;.......;nta_plozka
pricemz textovy polozky muzou obsahovat konec radky, pak ale nasledujici radek nezacina ampresandem a ten radek predtim konci paznakem "¤". No a ja potrebuju vytahat radky, ktery patreji k jedne tabulce. Delal sem to pomoc grep ^\&tbl; ale to prave zahodilo pokracovani zaznamu po \n. No vim, ye to je trivka, ale neumim ten sed temer pouzivat, awk vubec. Byl bych vdecnej za nejaky nakopnuti do zacatku (myslim to obrazne).
No, byl bysem schopnej na to napsat jednoduchej mlejnek v pajtnu, ale rad bych to udelal tim sedem/awkem, ktery sou na tohle asi mysleny.
Dikec Je.
Nejsem blbý, jen se hloupě ptám

Řešení dotazu:


Odpovědi

17.1.2011 21:32 Ondřej Kopka | skóre: 20 | blog: ondrejk
Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
Na tohle bude asi nejlepší awk, hledej v manuálu FS a RS.
17.1.2011 21:41 Ondřej Kubečka | skóre: 29 | blog: datlovo | Ulm
Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
Doufám, že to není domácí úkol. Pokud ano, tak nečtěte dále. ;)

Jinak stručně awk, bez kontroly čekohokoliv (mimochodem třeba výskytu ampersantu na začátku řádku, i když se nejedná o pokračování předchozího záznamu... což samozřejmě také lze ;), taky to neřeší předchozí existenci souborů a já nevím co, prostě jenom kousek v awk, co to rozseká), pokud správně chápu Váš vstup a to, co chcete, aby z toho vypadlo, třeba takto:
/usr/bin/awk -F';' '
/^&/ {
   filename=$1
   sub(/^&/,"",filename)
}
{
   print >> filename
}
' /cesta/k/vasemu/souboru
Prostě při každém průchodu, když řádek začne &, tak se položka do prvního středníku bez & uloží do proměnné filename. Každý řádek se přidá do souboru s aktuálním jménem filename.
18.1.2011 09:18 jeleniste | skóre: 13 | blog: Prokustovo lože
Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
Hehe, domácí úkol to není (respektive je to domácí úkol, kterej jsem dal sám sobě). Já to potřebuju do jednoho kšeftu, dělal jsem tyhle věci v pajtnu a zjistil jsem, že je možný je dělat rychlejc a elegantnějc. Dospěl sem k tomuto
grep ^\B 3212.vfk | sed 's/^\&[BD]\([A-Z]*\).*/grep ^\\\&[BD]\1\\\; 3212.vfk > ..\/parts\/\1_3212.vfk/' | bash
Ale to ten soubor prochází hodněkrát a navíc neumim udělat, aby to vzalo celej záznam i pokud obsahuje konec řádky. např:
&nejaka_tabulka;polozka;polozka;polozka¤
na¤
hodne¤
radku;polozka;polozka
z takovýho záznamu mě to veme jen ten první řádek. Řešení, který bych použil já by asi zahrnovalo \n¤ v regexp, protože regexp sem zvyklej používat, ale mam za to, že to musí jít udělat nějak jednodušejc a potřeboval bych nakopnout správným směrem. Nepotřebuju, aby za mě někdo dělal domácí úkoly...
Je.
btw: v čelákovicích 2* denně přesedam.
Nejsem blbý, jen se hloupě ptám
18.1.2011 10:25 chochi | skóre: 29 | Praha
Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
awk by to mel zvladnout celkem s prehledem. Napr.:

$ cat s
&jina_tabulka;polozka;polozka;polozka3;polozka;polozka¤
polozka
&nejaka_tabulka;polozka;polozka;polozka¤
na¤
hodne¤
radku;polozka;polozka
&nejaka_tabulka;polozka;polozka;polozka¤
2;polozka;polozka
&jina_tabulka;polozka;polozka;polozka3;polozka;polozka
&nejaka_tabulka;polozka;polozka;polozka3;polozka;polozka
$ rm -f nejaka_tabulka jina_tabulka 
$ gawk 'BEGIN {RS = "[^¤]\n"; ORS = ""; FS = ";"} /^&/{file=$1; sub(/^&/,"",file); print $0 RT >> file}' < s
$ cat nejaka_tabulka 
&nejaka_tabulka;polozka;polozka;polozka¤
na¤
hodne¤
radku;polozka;polozka
&nejaka_tabulka;polozka;polozka;polozka¤
2;polozka;polozka
&nejaka_tabulka;polozka;polozka;polozka3;polozka;polozka
$ cat jina_tabulka 
&jina_tabulka;polozka;polozka;polozka3;polozka;polozka¤
polozka
&jina_tabulka;polozka;polozka;polozka3;polozka;polozka
18.1.2011 11:10 jeleniste | skóre: 13 | blog: Prokustovo lože
Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
Díky, to je přesně vono. Když koukám co ten awk umí, si řikam, že sem s pythonem celkem chodil s kanónem na vrabce. Díky moc.
Nejsem blbý, jen se hloupě ptám
18.1.2011 11:15 jeleniste | skóre: 13 | blog: Prokustovo lože
Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
Ještě jeden dotaz. Je mi celkem jasný co to dělá, až na dvě věci, to ORS, jakej má v tutom skriptu smysl??
Nejsem blbý, jen se hloupě ptám
18.1.2011 11:18 jeleniste | skóre: 13 | blog: Prokustovo lože
Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
Když to zrušim, přidá mě to prázdný řádky. Aha. asi chápu.
Nejsem blbý, jen se hloupě ptám
18.1.2011 11:23 jeleniste | skóre: 13 | blog: Prokustovo lože
Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
Když zrušim to RT na konci, tak to blbne, co má dělat to RT??
Nejsem blbý, jen se hloupě ptám
18.1.2011 11:58 chochi | skóre: 29 | Praha
Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
Viz man awk :-).
ORS je "Output Record Separator" - ten se zapisuje mezi jednotli zaznamy na vystupu.
RS je "Input Record Separator" - zjednodusene je to regularni vyraz podle ktereho se vstup rozklada na jednotlive zaznamy.
RT je "Record terminator" - do tehle promene se nastavi ten text co matchuje RS.

Pri parsovani vstupu awk v $0 vraci jen zaznam, bez tech casti ktere je oddeluji (RS). Takhle, jelikoz se matchuji dva znaky, by je ten vystup neobsahovl (jejich hodnota je ulozena v RT).
Kdyz vypustis to RT tak zaznami by neobsohovaly posledni znak a novy radek.
Defaultni hodnota je RS = ORS = new line.
18.1.2011 12:33 jeleniste | skóre: 13 | blog: Prokustovo lože
Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
Aha, musel jsem si to zkusit, takže to RT vlastně awk nevnímá jako součást záznamu, ale jako oddělovač, tudíž ORS = "" a RT dávám proto, že kdybych nedal ORS a RT, tak mi to místo posledního znaku a konce řádu ustříhne poslední dva znaky a přidá konec řádku. Jasný. Díky.
Nejsem blbý, jen se hloupě ptám

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.