abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 16:22 | IT novinky

    Internetový prohlížeč Ladybird ohlásil tranzici z programovacího jazyka C++ do Rustu. Přechod bude probíhat postupně a nové komponenty budou dočasně koexistovat se stávajícím C++ kódem. Pro urychlení práce bude použita umělá inteligence, při portování první komponenty prohlížeče, JavaScriptového enginu LibJS, bylo během dvou týdnů pomocí nástrojů Claude Code a Codex vygenerováno kolem 25 000 řádků kódu. Nejedná se o čistě autonomní vývoj pomocí agentů.

    NUKE GAZA! 🎆 | Komentářů: 4
    včera 15:55 | Nová verze

    Byl vydán Mozilla Firefox 148.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Nově lze snadno povolit nebo zakázat jednotlivé AI funkce. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 148 bude brzy k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 2
    včera 12:44 | Nová verze

    Byla vydána nová verze 22.1.0, tj. první stabilní verze z nové řady 22.1.x, překladačové infrastruktury LLVM (Wikipedie). Přehled novinek v poznámkách k vydání: LLVM, Clang, LLD, Extra Clang Tools a Libc++.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | Humor

    X86CSS je experimentální webový emulátor instrukční sady x86 napsaný výhradně v CSS, tedy bez JavaScriptu nebo dalších dynamických prvků. Stránka 'spouští' assemblerovový program mikroprocesoru 8086 a názorně tak demonstruje, že i prosté CSS může fungovat jako Turingovsky kompletní jazyk. Zdrojový kód projektu je na GitHubu.

    NUKE GAZA! 🎆 | Komentářů: 6
    včera 12:11 | Nová verze

    Po šesti letech byla vydána nová verze 1.3 webového rozhraní ke gitovým repozitářům CGit.

    Ladislav Hagara | Komentářů: 0
    včera 02:33 | Nová verze

    Byla vydána nová verze 6.1 linuxové distribuce Lakka (Wikipedie), jež umožňuje transformovat podporované počítače v herní konzole. Nejnovější Lakka přichází s RetroArchem 1.22.2.

    Ladislav Hagara | Komentářů: 0
    včera 02:11 | Nová verze

    Matematický software GNU Octave byl vydán ve verzi 11.1.0. Podrobnosti v poznámkách k vydání. Vedle menších změn rozhraní jsou jako obvykle zahrnuta také výkonnostní vylepšení a zlepšení kompatibility s Matlabem.

    |🇵🇸 | Komentářů: 1
    23.2. 21:44 | Nová verze

    Weston, referenční implementace kompozitoru pro Wayland, byl vydán ve verzi 15.0.0. Přehled novinek v příspěvku na blogu společnosti Collabora. Vypíchnout lze Lua shell umožňující psát správu oken v jazyce Lua.

    Ladislav Hagara | Komentářů: 0
    23.2. 21:11 | Nová verze

    Organizace Apache Software Foundation (ASF) vydala verzi 29 integrovaného vývojového prostředí a vývojové platformy napsané v Javě NetBeans (Wikipedie). Přehled novinek na GitHubu. Instalovat lze také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 4
    23.2. 18:22 | IT novinky

    Ústavní soud na svých webových stránkách i v databázi NALUS (NÁLezy a USnesení Ústavního soudu) představil novou verzi chatbota využívajícího umělou inteligenci. Jeho posláním je usnadnit veřejnosti orientaci v rozsáhlé judikatuře Ústavního soudu a pomoci jí s vyhledáváním informací i na webových stránkách soudu, a to i v jiných jazycích. Jde o první nasazení umělé inteligence v rámci webových stránek a databází judikatury českých soudů.

    Ladislav Hagara | Komentářů: 18
    Které desktopové prostředí na Linuxu používáte?
     (18%)
     (6%)
     (0%)
     (11%)
     (27%)
     (2%)
     (5%)
     (1%)
     (12%)
     (26%)
    Celkem 953 hlasů
     Komentářů: 25, poslední 3.2. 19:50
    Rozcestník

    Dotaz: Rozddělit soubor pomocí sed/awk/grep

    17.1.2011 20:50 jeleniste | skóre: 13 | blog: Prokustovo lože
    Rozddělit soubor pomocí sed/awk/grep
    Přečteno: 532×
    Je to asi snadná věc, měl bych bejt schopnej to vylaborovat sám. Ale ani s awkem, ani se sedem sem za tim nedělal, no, za optání nic nedám.
    M8m soubor (kterej reprezentuje obsah databáze, jsou to vypsaný řádky tabulek). Formát je následující:
    &nazev_tabulky;prvni_polozka;druha_polozka;..;.....;.......;nta_plozka
    pricemz textovy polozky muzou obsahovat konec radky, pak ale nasledujici radek nezacina ampresandem a ten radek predtim konci paznakem "¤". No a ja potrebuju vytahat radky, ktery patreji k jedne tabulce. Delal sem to pomoc grep ^\&tbl; ale to prave zahodilo pokracovani zaznamu po \n. No vim, ye to je trivka, ale neumim ten sed temer pouzivat, awk vubec. Byl bych vdecnej za nejaky nakopnuti do zacatku (myslim to obrazne).
    No, byl bysem schopnej na to napsat jednoduchej mlejnek v pajtnu, ale rad bych to udelal tim sedem/awkem, ktery sou na tohle asi mysleny.
    Dikec Je.
    Nejsem blbý, jen se hloupě ptám

    Řešení dotazu:


    Odpovědi

    17.1.2011 21:32 Ondřej Kopka | skóre: 19 | blog: ondrejk
    Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
    Na tohle bude asi nejlepší awk, hledej v manuálu FS a RS.
    17.1.2011 21:41 Ondřej Kubečka | skóre: 29 | blog: datlovo | Ulm
    Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
    Doufám, že to není domácí úkol. Pokud ano, tak nečtěte dále. ;)

    Jinak stručně awk, bez kontroly čekohokoliv (mimochodem třeba výskytu ampersantu na začátku řádku, i když se nejedná o pokračování předchozího záznamu... což samozřejmě také lze ;), taky to neřeší předchozí existenci souborů a já nevím co, prostě jenom kousek v awk, co to rozseká), pokud správně chápu Váš vstup a to, co chcete, aby z toho vypadlo, třeba takto:
    /usr/bin/awk -F';' '
    /^&/ {
       filename=$1
       sub(/^&/,"",filename)
    }
    {
       print >> filename
    }
    ' /cesta/k/vasemu/souboru
    
    Prostě při každém průchodu, když řádek začne &, tak se položka do prvního středníku bez & uloží do proměnné filename. Každý řádek se přidá do souboru s aktuálním jménem filename.
    18.1.2011 09:18 jeleniste | skóre: 13 | blog: Prokustovo lože
    Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
    Hehe, domácí úkol to není (respektive je to domácí úkol, kterej jsem dal sám sobě). Já to potřebuju do jednoho kšeftu, dělal jsem tyhle věci v pajtnu a zjistil jsem, že je možný je dělat rychlejc a elegantnějc. Dospěl sem k tomuto
    grep ^\B 3212.vfk | sed 's/^\&[BD]\([A-Z]*\).*/grep ^\\\&[BD]\1\\\; 3212.vfk > ..\/parts\/\1_3212.vfk/' | bash
    Ale to ten soubor prochází hodněkrát a navíc neumim udělat, aby to vzalo celej záznam i pokud obsahuje konec řádky. např:
    &nejaka_tabulka;polozka;polozka;polozka¤
    na¤
    hodne¤
    radku;polozka;polozka
    z takovýho záznamu mě to veme jen ten první řádek. Řešení, který bych použil já by asi zahrnovalo \n¤ v regexp, protože regexp sem zvyklej používat, ale mam za to, že to musí jít udělat nějak jednodušejc a potřeboval bych nakopnout správným směrem. Nepotřebuju, aby za mě někdo dělal domácí úkoly...
    Je.
    btw: v čelákovicích 2* denně přesedam.
    Nejsem blbý, jen se hloupě ptám
    18.1.2011 10:25 chochi | skóre: 29 | Praha
    Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
    awk by to mel zvladnout celkem s prehledem. Napr.:
    
    $ cat s
    &jina_tabulka;polozka;polozka;polozka3;polozka;polozka¤
    polozka
    &nejaka_tabulka;polozka;polozka;polozka¤
    na¤
    hodne¤
    radku;polozka;polozka
    &nejaka_tabulka;polozka;polozka;polozka¤
    2;polozka;polozka
    &jina_tabulka;polozka;polozka;polozka3;polozka;polozka
    &nejaka_tabulka;polozka;polozka;polozka3;polozka;polozka
    $ rm -f nejaka_tabulka jina_tabulka 
    $ gawk 'BEGIN {RS = "[^¤]\n"; ORS = ""; FS = ";"} /^&/{file=$1; sub(/^&/,"",file); print $0 RT >> file}' < s
    $ cat nejaka_tabulka 
    &nejaka_tabulka;polozka;polozka;polozka¤
    na¤
    hodne¤
    radku;polozka;polozka
    &nejaka_tabulka;polozka;polozka;polozka¤
    2;polozka;polozka
    &nejaka_tabulka;polozka;polozka;polozka3;polozka;polozka
    $ cat jina_tabulka 
    &jina_tabulka;polozka;polozka;polozka3;polozka;polozka¤
    polozka
    &jina_tabulka;polozka;polozka;polozka3;polozka;polozka
    
    18.1.2011 11:10 jeleniste | skóre: 13 | blog: Prokustovo lože
    Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
    Díky, to je přesně vono. Když koukám co ten awk umí, si řikam, že sem s pythonem celkem chodil s kanónem na vrabce. Díky moc.
    Nejsem blbý, jen se hloupě ptám
    18.1.2011 11:15 jeleniste | skóre: 13 | blog: Prokustovo lože
    Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
    Ještě jeden dotaz. Je mi celkem jasný co to dělá, až na dvě věci, to ORS, jakej má v tutom skriptu smysl??
    Nejsem blbý, jen se hloupě ptám
    18.1.2011 11:18 jeleniste | skóre: 13 | blog: Prokustovo lože
    Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
    Když to zrušim, přidá mě to prázdný řádky. Aha. asi chápu.
    Nejsem blbý, jen se hloupě ptám
    18.1.2011 11:23 jeleniste | skóre: 13 | blog: Prokustovo lože
    Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
    Když zrušim to RT na konci, tak to blbne, co má dělat to RT??
    Nejsem blbý, jen se hloupě ptám
    18.1.2011 11:58 chochi | skóre: 29 | Praha
    Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
    Viz man awk :-).
    ORS je "Output Record Separator" - ten se zapisuje mezi jednotli zaznamy na vystupu.
    RS je "Input Record Separator" - zjednodusene je to regularni vyraz podle ktereho se vstup rozklada na jednotlive zaznamy.
    RT je "Record terminator" - do tehle promene se nastavi ten text co matchuje RS.

    Pri parsovani vstupu awk v $0 vraci jen zaznam, bez tech casti ktere je oddeluji (RS). Takhle, jelikoz se matchuji dva znaky, by je ten vystup neobsahovl (jejich hodnota je ulozena v RT).
    Kdyz vypustis to RT tak zaznami by neobsohovaly posledni znak a novy radek.
    Defaultni hodnota je RS = ORS = new line.
    18.1.2011 12:33 jeleniste | skóre: 13 | blog: Prokustovo lože
    Rozbalit Rozbalit vše Re: Rozddělit soubor pomocí sed/awk/grep
    Aha, musel jsem si to zkusit, takže to RT vlastně awk nevnímá jako součást záznamu, ale jako oddělovač, tudíž ORS = "" a RT dávám proto, že kdybych nedal ORS a RT, tak mi to místo posledního znaku a konce řádu ustříhne poslední dva znaky a přidá konec řádku. Jasný. Díky.
    Nejsem blbý, jen se hloupě ptám

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.