Přihlášení | Registrace

napište » Zprávičky

Dibuja 0.26.0

dnes 11:44 | Nová verze

Dibuja je jednoduchý kreslící program inspirovaný programy Paintbrush pro macOS a Malování pro Windows. Vydána byla verze 0.26.0.

Ladislav Hagara | Komentářů: 0

DietPi 9.13

včera 23:33 | Nová verze

Byla vydána nová verze 9.13 z Debianu vycházející linuxové distribuce DietPi pro (nejenom) jednodeskové počítače. Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Týden v GNOME a Týden v KDE Plasma (30. a 31. května 2025)

včera 21:44 | Komunita

Na čem aktuálně pracují vývojáři GNOME a KDE Plasma? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE Plasma.

Ladislav Hagara | Komentářů: 0

Alpine Linux 3.22.0

včera 16:33 | Nová verze

Byla vydána nová stabilní verze 3.22.0, tj. první z nové řady 3.22, minimalistické linuxové distribuce zaměřené na bezpečnost Alpine Linux (Wikipedie) postavené na standardní knihovně jazyka C musl libc a BusyBoxu. Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

FEL ČVUT vyvinula robotickou stavebnici pro mladé programátory

30.5. 00:33 | IT novinky

FEL ČVUT vyvinula robotickou stavebnici pro mladé programátory. Stavebnice Brian byla navržená speciálně pro potřeby populární Robosoutěže. Jde ale také o samostatný produkt, který si může koupit každý fanoušek robotiky a programování od 10 let, ideální je i pro střední školy jako výuková pomůcka. Jádro stavebnice tvoří programovatelná řídicí jednotka, kterou vyvinul tým z FEL ČVUT ve spolupráci s průmyslovými partnery. Stavebnici

… více »

Ladislav Hagara | Komentářů: 45

Ubuntu bude pro testování nových verzí vydávat měsíční snapshoty

29.5. 20:33 | Komunita

Ubuntu bude pro testování nových verzí vydávat měsíční snapshoty. Dnes vyšel 1. snapshot Ubuntu 25.10 (Questing Quokka).

Ladislav Hagara | Komentářů: 0

pfSense Community Edition (CE) 2.8.0

29.5. 14:55 | Nová verze

Společnost Netgate oznámila vydání nové verze 2.8.0 open source firewallové, routovací a VPN platformy pfSense (Wikipedie) postavené na FreeBSD. Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Tails 6.16

29.5. 14:00 | Nová verze

Byla vydána nová verze 6.16 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Tor Browser byl povýšen na verzi 14.5.3. Linux na verzi 6.1.140. Další změny v příslušném seznamu.

Ladislav Hagara | Komentářů: 0

Deník N: Odsouzený muž daroval ministerstvu bitcoiny, řeší to policie

29.5. 12:33 | Zajímavý článek

Člověk odsouzený za obchod s drogami daroval letos ministerstvu spravedlnosti 468 kusů kryptoměny bitcoin, které pak resort v aukcích prodal za skoro miliardu korun. Darováním se zabývá policejní Národní centrála proti organizovanému zločinu (NCOZ). Deníku N to potvrdil přímo ministr spravedlnosti Pavel Blažek (ODS). Podle resortu bylo nicméně vše v souladu s právem.

Ladislav Hagara | Komentářů: 59

Sigil a PageEdit 2.5.0

28.5. 20:44 | Nová verze

Svobodný a otevřený multiplatformní editor EPUB souborů Sigil (Wikipedie, GitHub) byl vydán ve verzi 2.5.0. Stejně tak doprovodný vizuální EPUB XHTML editor PageEdit (GitHub).

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Jaký je váš oblíbený skriptovací jazyk?

bash (56%)

python (31%)

perl (7%)

powershell (2%)

batch (0%)

vbscript (1%)

jiný, uvedu v diskusi (3%)

Celkem 171 hlasů

Komentářů: 13, poslední 30.5. 12:26

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / awk - vypis dvojrozmerneho pola do tvaru mriezky

Štítky: AWK, data, For, pole, poli, pravidla

Dotaz: awk - vypis dvojrozmerneho pola do tvaru mriezky

11.2.2013 05:32 victor8 | skóre: 24 | blog: blog | Košice
awk - vypis dvojrozmerneho pola do tvaru mriezky

Přečteno: 248×

Odpovědět | Admin

Zdravim nespavcov :) Uz dlhsi cas sa mordujem so spracovanim vstupnych dat v tvare:

#attr2:attr3:attr6:attr5
value2r1:value3r1:value6r1:value5r1
#attr1:attr5:attr3:attr2:attr6
value1r2:value5r2:value3r2:value2r2:value6r2
value1r3:value5r3:value3r3:value2r3:value6r3
#attr8:attr2:attr3:attr4:attr5:attr7:attr1
#attr1:attr2:attr3:attr5
value1r4:value2r4:value3r4:value5r4

Pravidla pre tvar vstupneho suboru:

oddelovacom riadkov je LF
oddelovacom stlpcov je ":"
Subor sa sklada z blokov. Kazdy blok pozostava z riadka zacinajuceho mriezkou (obsahuje nazvy atributov), ktory moze (ale nemusi) byt nasledovany riadkami s hodnotami.
Poradie atributov sa v jednotlivych blokoch moze menit
Pocet a vyskyt atributov sa moze v jednotlivych blokoch menit

Mojim cielom je dostat ich do tvaru:

#attr1:attr2:attr3:attr4:attr5:attr6:attr7:attr8
:value2r1:value3r1::value5r1:value6r1
value1r2:value2r2:value3r2::value5r2:value6r2
value1r3:value2r3:value3r3::value5r3:value6r3
value1r4:value2r4:value3r4::value5r4

pripadne:

#attr1:attr2:attr3:attr4:attr5:attr6:attr7:attr8
:value2-1:value3-1::value5-1:value6-1::
value1-2:value2-2:value3-2::value5-2:value6-2::
value1-3:value2-3:value3-3::value5-3:value6-3::
value1-4:value2-4:value3-4::value5-4:::

cize, vertikalne ich zarovnat a zoradit podla attrX, ktore budu vypisane v prvom riadku vystupneho suboru ako hlavicka. Cielom je predpriprava suboru na dalsie spracovanie tabulkovym kalkulatorom. Viacero dvojbodiek na konci riadka ako je ukazane vyssie nicomu neprekaza, ale ani nie je potrebnych. (vychadzam z toho ze ich povolenim by sa dal zjednodusit kod, a tabulkovy kalkulator ich aj tak odignoruje

Zatial som dospel k nasledovnemu:

awk '
BEGIN { OFS=FS=":"; record=0 }

# spracovanie zaciatku bloku; nazvy premennych ukladam do attr[i]
{
 if ($0 ~ /^#/) {
  columns=split(substr($0,2),attr);
  #print"\n"; for(i in attr) print "attr["i"] = "attr[i]; #debug1
  next;
 }

# spracovanie riadkov s hodnotami; hodnoty ukladam do r[record, attr[i]]
 record++;
 numvalues=split($0,value);
  for(i=1;i<=numvalues;i++) {
   r[record SUBSEP attr[i]]= value[i];
   print "r ["record", "attr[i]"] = "r[record SUBSEP attr[i]];  #debug2
  }
}

END{
 print "-----" #debug3

 for (combined in r) {
  #print combined;   #debug4
  num=split(combined, separate, SUBSEP);
  #print separate[1], separate[2], r[separate[1] SUBSEP separate[2]]; #debug5
  # a co dal?
}

Vystupom z debug2 je

r [1, attr2] = value2r1
r [1, attr3] = value3r1
r [1, attr6] = value6r1
r [1, attr5] = value5r1
r [2, attr1] = value1r2
r [2, attr5] = value5r2
r [2, attr3] = value3r2
r [2, attr2] = value2r2
r [2, attr6] = value6r2
r [3, attr1] = value1r3
r [3, attr5] = value5r3
r [3, attr3] = value3r3
r [3, attr2] = value2r3
r [3, attr6] = value6r3
r [4, attr1] = value1r4
r [4, attr2] = value2r4
r [4, attr3] = value3r4
r [4, attr5] = value5r4

, takze verim, ze data mam rozparsovane a ulozene v asociativnom poli v poriadku.

Problemom pre mna je, ako z tohoto vyskladat vysledny vypis. Potrebujem nejako rozumne toto pole vyiterovat, no napada ma len klasicka konstrukcia: dva zanorene fory, ktora mi tu ale fungovat nebude, kedze nemam dva pouzitelne indexy.

Nejake napady? :)

Řešení dotazu:

Komentář #2 (chochi, 1 hlasů)

Nástroje: Začni sledovat (1) ?

Odpovědi

11.2.2013 10:06 l4m4
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky

Je to nutné dělat v awk?

Samozřejmě to je možné dělat v awk, ale jelikož je nutné si celý soubor rozparsovat do datových struktur, protože chceš mít ve výsledné hlavičce sjednocení všech atributů, udělal bych to v pythonu:

import sys

attrs = set()
data = []
for line in sys.stdin:
    line = line.strip()
    if not line:
        continue
    if line[0] == '#':
        currentattrs = line[1:].split(':')
        attrs.update(currentattrs)
    else:
        data.append(dict(zip(currentattrs, line.split(':'))))

keys = list(sorted(attrs))
print '#' + ':'.join(keys)
for row in data:
    print ':'.join(row.get(k, '') for k in keys)

11.2.2013 13:46 victor8 | skóre: 24 | blog: blog | Košice
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky

Vdaka za tip ako to spravit v Pythone.

Bohuzial je to nutne robit v awk, nakolko na servri kde to bude bezat nic ine okrem (plain) awk a sedu nemam a nainstalovat si tam python nemozem :)

Řešení 1× (victor8 (tazatel))

11.2.2013 10:55 chochi | skóre: 29 | Praha
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky

Zaklad je si pripravit pole se vsemi attributy. V awk napriklad takto:

BEGIN {
    OFS=FS=":"; record=0
}

# spracovanie zaciatku bloku; nazvy premennych ukladam do attr[i]
{
    if ($0 ~ /^#/) {
        columns = split(substr($0, 2), attr);
        for(c in attr) {
            # ulozim si vsechny attributy
            all[attr[c]] = attr[c];
        }
        next;
    }

    # spracovanie riadkov s hodnotami; hodnoty ukladam do r[record, attr[i]]
    record++;
    numvalues = split($0, value);
    for(i = 1; i <= numvalues; i++) {
        r[record, attr[i]] = value[i];
    }
}

END{
    nc = asort(all, sort);
    # vypis hlavicky
    ORS = "";
    print("#");
    ORS = ":";
    for (c = 1; c < nc; c++) {
        print(sort[c]);
    }
    ORS = "\n";
    print(sort[c]);
    # vypis obsahu
    for (l = 1; l <= record; l++) {
        ORS = ":";
        for (c = 1; c < nc; c++) {
            print(r[l, sort[c]]);
        }
        ORS = "\n";
        print(r[l, sort[c]]);
    }
}

Vysledek:

$ awk -f s.awk < in.txt 
#attr1:attr2:attr3:attr4:attr5:attr6:attr7:attr8
:value2r1:value3r1::value5r1:value6r1::
value1r2:value2r2:value3r2::value5r2:value6r2::
value1r3:value2r3:value3r3::value5r3:value6r3::
value1r4:value2r4:value3r4::value5r4:::

11.2.2013 13:13 l4m4
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky

Ano, v awk to sice lze, ale...

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje