abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
včera 17:02 | Pozvánky

Přijďte si popovídat o open source obecně a openSUSE konkrétně s dalšími uživateli a vývojáři. Oslava nového vydání openSUSE Leap se uskuteční 16. prosince od 17:00 v nových prostorách firmy SUSE v Praze. K dispozici bude nějaké občerstvení a DVD pro ty, kdo je sbírají nebo ještě mají mechaniku. Po párty v kanceláři se bude pokračovat v některé z hospod v okolí.

Miška | Komentářů: 7
včera 14:55 | Zajímavý software

Byla vydána verze Alpha 1.0 otevřeného operačního systému pro chytré hodinky AsteroidOS. Podporovány jsou hodinky LG G Watch, LG G Watch Urbane, Asus ZenWatch 2 a Sony Smartwatch 3. Ukázka ovládání hodinek na YouTube. Jaroslav Řezník přednášel o AsteroidOS na chytrých hodinkách (videozáznam) na letošní konferenci OpenAlt.

Ladislav Hagara | Komentářů: 0
včera 13:30 | Zajímavý software

Byly uvolněny zdrojové kódy známé rogue-like hry DoomRL. Počátky hry jsou v roce 2002. Je napsána ve FreePascalu a zdrojový kód je nyní k dispozici na GitHubu pod licencí GNU GPL 2.0. Autor pracuje na nové hře Jupiter Hell, která je moderním nástupcem DoomRL a na jejíž vývoj shání peníze prostřednictvím Kickstarteru.

Blaazen | Komentářů: 0
včera 13:15 | Pozvánky

Přijďte s námi oslavit vydání Fedory 25. Na programu budou přednášky o novinkách, diskuse, neřízený networking atd. Release Party se bude konat 16. prosince v prostorách společnosti Etnetera. Na party budou volně k dispozici také propagační materiály, nová DVD s Fedorou 25 a samozřejmě občerstvení. Přednášky budou probíhat v češtině. Pro více informací se můžete podívat na web MojeFedora.cz. Jen připomínám, že tentokrát jsme zavedli

… více »
frantisekz | Komentářů: 0
9.12. 16:38 | Komunita

Byly zveřejněny videozáznamy přednášek a workshopů z letošní konference OpenAlt konané 5. a 6. listopadu v Brně. K videozáznamům lze přistupovat ze stránky na SuperLectures nebo přes program konference, detaily o vybrané přednášce nebo workshopu a dále kliknutím na ikonku filmového pásu. Celkově bylo zpracováno 65 hodin z 89 přednášek a workshopů.

Ladislav Hagara | Komentářů: 0
9.12. 11:30 | Komunita

Bylo oznámeno, že bude proveden bezpečnostní audit zdrojových kódů open source softwaru pro implementaci virtuálních privátních sítí OpenVPN. Audit provede Matthew D. Green (blog), uznávaný kryptolog a profesor na Univerzitě Johnse Hopkinse. Auditována bude verze 2.4 (aktuálně RC 1, stabilní verze je 2.3.14). Audit bude financován společností Private Internet Access [reddit].

Ladislav Hagara | Komentářů: 4
9.12. 06:00 | Komunita

Na YouTube byl publikován Blender Institute Reel 2016, ani ne dvouminutový sestřih z filmů, které vznikly za posledních 10 let díky Blender Institutu. V institutu aktuálně pracují na novém filmu Agent 327. Dění kolem filmu lze sledovat na Blender Cloudu. Videoukázka Agenta 327 z června letošního roku na YouTube.

Ladislav Hagara | Komentářů: 0
9.12. 01:02 | Zajímavý článek

Minulý týden byly vydány verze 1.2.3 a 1.1.7 webového poštovního klienta Roundcube. V oznámení o vydání bylo zmíněno řešení bezpečnostního problému nalezeného společností RIPS a souvisejícího s voláním funkce mail() v PHP. Tento týden byly zveřejněny podrobnosti. Útočník mohl pomocí speciálně připraveného emailu spustit na serveru libovolný příkaz. Stejně, jak je popsáno v článku Exploit PHP’s mail() to get remote code execution z roku 2014.

Ladislav Hagara | Komentářů: 1
8.12. 16:00 | Nová verze

Byla vydána verze 0.98 svobodného nelineárního video editoru Pitivi. Z novinek lze zmínit například přizpůsobitelné klávesové zkratky. Videoukázka práce s nejnovější verzí Pitivi na YouTube.

Ladislav Hagara | Komentářů: 1
8.12. 15:00 | Zajímavý software

Stop motion je technika animace, při níž je reálný objekt mezi jednotlivými snímky ručně upravován a posouván o malé úseky, tak aby po spojení vyvolala animace dojem spojitosti. Jaký software lze pro stop motion použít na Linuxu? Článek na OMG! Ubuntu! představuje Heron Animation. Ten bohužel podporuje pouze webové kamery. Podpora digitálních zrcadlovek je začleněna například v programu qStopMotion.

Ladislav Hagara | Komentářů: 5
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (23%)
 (29%)
 (7%)
 (5%)
 (3%)
Celkem 810 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama

Dotaz: awk - vypis dvojrozmerneho pola do tvaru mriezky

11.2.2013 05:32 victor8 | skóre: 24 | blog: blog | Košice
awk - vypis dvojrozmerneho pola do tvaru mriezky
Přečteno: 203×

Zdravim nespavcov :) Uz dlhsi cas sa mordujem so spracovanim vstupnych dat v tvare:

#attr2:attr3:attr6:attr5
value2r1:value3r1:value6r1:value5r1
#attr1:attr5:attr3:attr2:attr6
value1r2:value5r2:value3r2:value2r2:value6r2
value1r3:value5r3:value3r3:value2r3:value6r3
#attr8:attr2:attr3:attr4:attr5:attr7:attr1
#attr1:attr2:attr3:attr5
value1r4:value2r4:value3r4:value5r4

Pravidla pre tvar vstupneho suboru:

  • oddelovacom riadkov je LF
  • oddelovacom stlpcov je ":"
  • Subor sa sklada z blokov. Kazdy blok pozostava z riadka zacinajuceho mriezkou (obsahuje nazvy atributov), ktory moze (ale nemusi) byt nasledovany riadkami s hodnotami.
  • Poradie atributov sa v jednotlivych blokoch moze menit
  • Pocet a vyskyt atributov sa moze v jednotlivych blokoch menit

Mojim cielom je dostat ich do tvaru:

#attr1:attr2:attr3:attr4:attr5:attr6:attr7:attr8
:value2r1:value3r1::value5r1:value6r1
value1r2:value2r2:value3r2::value5r2:value6r2
value1r3:value2r3:value3r3::value5r3:value6r3
value1r4:value2r4:value3r4::value5r4

pripadne:

#attr1:attr2:attr3:attr4:attr5:attr6:attr7:attr8
:value2-1:value3-1::value5-1:value6-1::
value1-2:value2-2:value3-2::value5-2:value6-2::
value1-3:value2-3:value3-3::value5-3:value6-3::
value1-4:value2-4:value3-4::value5-4:::

cize, vertikalne ich zarovnat a zoradit podla attrX, ktore budu vypisane v prvom riadku vystupneho suboru ako hlavicka. Cielom je predpriprava suboru na dalsie spracovanie tabulkovym kalkulatorom. Viacero dvojbodiek na konci riadka ako je ukazane vyssie nicomu neprekaza, ale ani nie je potrebnych. (vychadzam z toho ze ich povolenim by sa dal zjednodusit kod, a tabulkovy kalkulator ich aj tak odignoruje

Zatial som dospel k nasledovnemu:

awk '
BEGIN { OFS=FS=":"; record=0 }

# spracovanie zaciatku bloku; nazvy premennych ukladam do attr[i]
{
 if ($0 ~ /^#/) {
  columns=split(substr($0,2),attr);
  #print"\n"; for(i in attr) print "attr["i"] = "attr[i]; #debug1
  next;
 }

# spracovanie riadkov s hodnotami; hodnoty ukladam do r[record, attr[i]]
 record++;
 numvalues=split($0,value);
  for(i=1;i<=numvalues;i++) {
   r[record SUBSEP attr[i]]= value[i];
   print "r ["record", "attr[i]"] = "r[record SUBSEP attr[i]];  #debug2
  }
}

END{
 print "-----" #debug3

 for (combined in r) {
  #print combined;   #debug4
  num=split(combined, separate, SUBSEP);
  #print separate[1], separate[2], r[separate[1] SUBSEP separate[2]]; #debug5
  # a co dal?
}


Vystupom z debug2 je

r [1, attr2] = value2r1
r [1, attr3] = value3r1
r [1, attr6] = value6r1
r [1, attr5] = value5r1
r [2, attr1] = value1r2
r [2, attr5] = value5r2
r [2, attr3] = value3r2
r [2, attr2] = value2r2
r [2, attr6] = value6r2
r [3, attr1] = value1r3
r [3, attr5] = value5r3
r [3, attr3] = value3r3
r [3, attr2] = value2r3
r [3, attr6] = value6r3
r [4, attr1] = value1r4
r [4, attr2] = value2r4
r [4, attr3] = value3r4
r [4, attr5] = value5r4
, takze verim, ze data mam rozparsovane a ulozene v asociativnom poli v poriadku.

Problemom pre mna je, ako z tohoto vyskladat vysledny vypis. Potrebujem nejako rozumne toto pole vyiterovat, no napada ma len klasicka konstrukcia: dva zanorene fory, ktora mi tu ale fungovat nebude, kedze nemam dva pouzitelne indexy.

Nejake napady? :)


Řešení dotazu:


Odpovědi

11.2.2013 10:06 l4m4
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky
Je to nutné dělat v awk?

Samozřejmě to je možné dělat v awk, ale jelikož je nutné si celý soubor rozparsovat do datových struktur, protože chceš mít ve výsledné hlavičce sjednocení všech atributů, udělal bych to v pythonu:
import sys

attrs = set()
data = []
for line in sys.stdin:
    line = line.strip()
    if not line:
        continue
    if line[0] == '#':
        currentattrs = line[1:].split(':')
        attrs.update(currentattrs)
    else:
        data.append(dict(zip(currentattrs, line.split(':'))))

keys = list(sorted(attrs))
print '#' + ':'.join(keys)
for row in data:
    print ':'.join(row.get(k, '') for k in keys)
11.2.2013 13:46 victor8 | skóre: 24 | blog: blog | Košice
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky
Vdaka za tip ako to spravit v Pythone.

Bohuzial je to nutne robit v awk, nakolko na servri kde to bude bezat nic ine okrem (plain) awk a sedu nemam a nainstalovat si tam python nemozem :)
Řešení 1× (victor8 (tazatel))
11.2.2013 10:55 chochi | skóre: 29 | Praha
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky
Zaklad je si pripravit pole se vsemi attributy. V awk napriklad takto:
BEGIN {
    OFS=FS=":"; record=0
}

# spracovanie zaciatku bloku; nazvy premennych ukladam do attr[i]
{
    if ($0 ~ /^#/) {
        columns = split(substr($0, 2), attr);
        for(c in attr) {
            # ulozim si vsechny attributy
            all[attr[c]] = attr[c];
        }
        next;
    }

    # spracovanie riadkov s hodnotami; hodnoty ukladam do r[record, attr[i]]
    record++;
    numvalues = split($0, value);
    for(i = 1; i <= numvalues; i++) {
        r[record, attr[i]] = value[i];
    }
}

END{
    nc = asort(all, sort);
    # vypis hlavicky
    ORS = "";
    print("#");
    ORS = ":";
    for (c = 1; c < nc; c++) {
        print(sort[c]);
    }
    ORS = "\n";
    print(sort[c]);
    # vypis obsahu
    for (l = 1; l <= record; l++) {
        ORS = ":";
        for (c = 1; c < nc; c++) {
            print(r[l, sort[c]]);
        }
        ORS = "\n";
        print(r[l, sort[c]]);
    }
}
Vysledek:
$ awk -f s.awk < in.txt 
#attr1:attr2:attr3:attr4:attr5:attr6:attr7:attr8
:value2r1:value3r1::value5r1:value6r1::
value1r2:value2r2:value3r2::value5r2:value6r2::
value1r3:value2r3:value3r3::value5r3:value6r3::
value1r4:value2r4:value3r4::value5r4:::
11.2.2013 13:13 l4m4
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky
Ano, v awk to sice lze, ale...

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.