Přihlášení | Registrace

napište » Zprávičky

dnes 17:11 | Nová verze

Byl vydán Nextcloud Hub 8. Představení novinek tohoto open source cloudového řešení také na YouTube. Vypíchnout lze Nextcloud AI Assistant 2.0.

Ladislav Hagara | Komentářů: 0

Pharo 12.0

dnes 13:33 | Nová verze

Vyšlo Pharo 12.0, programovací jazyk a vývojové prostředí s řadou pokročilých vlastností. Krom tradiční nadílky oprav přináší nový systém správy ladících bodů, nový způsob definice tříd, prostor pro objekty, které nemusí procházet GC a mnoho dalšího.

Pavel Křivánek | Komentářů: 2

Microsoft zveřejnil na GitHubu zdrojové kódy MS-DOSu 4.0 pod licencí MIT

dnes 04:55 | Zajímavý software

Microsoft zveřejnil na GitHubu zdrojové kódy MS-DOSu 4.0 pod licencí MIT. Ve stejném repozitáři se nacházejí i před lety zveřejněné zdrojové k kódy MS-DOSu 1.25 a 2.0.

Ladislav Hagara | Komentářů: 28

Ubuntu 24.04 LTS Noble Numbat

včera 17:33 | Nová verze

Canonical vydal (email, blog, YouTube) Ubuntu 24.04 LTS Noble Numbat. Přehled novinek v poznámkách k vydání a také příspěvcích na blogu: novinky v desktopu a novinky v bezpečnosti. Vydány byly také oficiální deriváty Edubuntu, Kubuntu, Lubuntu, Ubuntu Budgie, Ubuntu Cinnamon, Ubuntu Kylin, Ubuntu MATE, Ubuntu Studio, Ubuntu Unity a Xubuntu. Jedná se o 10. LTS verzi.

Ladislav Hagara | Komentářů: 13

Videozáznam z Czech Open Source Policy Forum 2024

včera 14:22 | Komunita

Na YouTube je k dispozici videozáznam z včerejšího Czech Open Source Policy Forum 2024.

Ladislav Hagara | Komentářů: 2

Fossil 2.24

včera 13:22 | Nová verze

Fossil (Wikipedie) byl vydán ve verzi 2.24. Jedná se o distribuovaný systém správy verzí propojený se správou chyb, wiki stránek a blogů s integrovaným webovým rozhraním. Vše běží z jednoho jediného spustitelného souboru a uloženo je v SQLite databázi.

Ladislav Hagara | Komentářů: 0

Vivaldi 6.7

včera 12:44 | Nová verze

Byla vydána nová stabilní verze 6.7 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 124. Přehled novinek i s náhledy v příspěvku na blogu. Vypíchnout lze Spořič paměti (Memory Saver) automaticky hibernující karty, které nebyly nějakou dobu používány nebo vylepšené Odběry (Feed Reader).

Ladislav Hagara | Komentářů: 0

Node.js 22

včera 04:55 | Nová verze

OpenJS Foundation, oficiální projekt konsorcia Linux Foundation, oznámila vydání verze 22 otevřeného multiplatformního prostředí pro vývoj a běh síťových aplikací napsaných v JavaScriptu Node.js (Wikipedie). V říjnu se verze 22 stane novou aktivní LTS verzí. Podpora je plánována do dubna 2027.

Ladislav Hagara | Komentářů: 0

Proxmox Virtual Environment 8.2

včera 04:22 | Nová verze

Byla vydána verze 8.2 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu. Zdůrazněn je průvodce migrací hostů z VMware ESXi do Proxmoxu.

Ladislav Hagara | Komentářů: 0

R 4.4.0 (Puppy Cup)

včera 04:11 | Nová verze

R (Wikipedie), programovací jazyk a prostředí určené pro statistickou analýzu dat a jejich grafické zobrazení, bylo vydáno ve verzi 4.4.0. Její kódové jméno je Puppy Cup.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

KDE Plasma 6

už používám (73%)

čekám, až se dostane do mé distibuce (9%)

čekám na pozdější vydání v řadě (2%)

preferuji jiné desktopové prostředí (16%)

Celkem 795 hlasů

Komentářů: 4, poslední 6.4. 15:51

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / awk - vypis dvojrozmerneho pola do tvaru mriezky

Štítky: AWK, data, For, pole, poli, pravidla

Dotaz: awk - vypis dvojrozmerneho pola do tvaru mriezky

11.2.2013 05:32 victor8 | skóre: 24 | blog: blog | Košice
awk - vypis dvojrozmerneho pola do tvaru mriezky

Přečteno: 230×

Odpovědět | Admin

Zdravim nespavcov :) Uz dlhsi cas sa mordujem so spracovanim vstupnych dat v tvare:

#attr2:attr3:attr6:attr5
value2r1:value3r1:value6r1:value5r1
#attr1:attr5:attr3:attr2:attr6
value1r2:value5r2:value3r2:value2r2:value6r2
value1r3:value5r3:value3r3:value2r3:value6r3
#attr8:attr2:attr3:attr4:attr5:attr7:attr1
#attr1:attr2:attr3:attr5
value1r4:value2r4:value3r4:value5r4

Pravidla pre tvar vstupneho suboru:

oddelovacom riadkov je LF
oddelovacom stlpcov je ":"
Subor sa sklada z blokov. Kazdy blok pozostava z riadka zacinajuceho mriezkou (obsahuje nazvy atributov), ktory moze (ale nemusi) byt nasledovany riadkami s hodnotami.
Poradie atributov sa v jednotlivych blokoch moze menit
Pocet a vyskyt atributov sa moze v jednotlivych blokoch menit

Mojim cielom je dostat ich do tvaru:

#attr1:attr2:attr3:attr4:attr5:attr6:attr7:attr8
:value2r1:value3r1::value5r1:value6r1
value1r2:value2r2:value3r2::value5r2:value6r2
value1r3:value2r3:value3r3::value5r3:value6r3
value1r4:value2r4:value3r4::value5r4

pripadne:

#attr1:attr2:attr3:attr4:attr5:attr6:attr7:attr8
:value2-1:value3-1::value5-1:value6-1::
value1-2:value2-2:value3-2::value5-2:value6-2::
value1-3:value2-3:value3-3::value5-3:value6-3::
value1-4:value2-4:value3-4::value5-4:::

cize, vertikalne ich zarovnat a zoradit podla attrX, ktore budu vypisane v prvom riadku vystupneho suboru ako hlavicka. Cielom je predpriprava suboru na dalsie spracovanie tabulkovym kalkulatorom. Viacero dvojbodiek na konci riadka ako je ukazane vyssie nicomu neprekaza, ale ani nie je potrebnych. (vychadzam z toho ze ich povolenim by sa dal zjednodusit kod, a tabulkovy kalkulator ich aj tak odignoruje

Zatial som dospel k nasledovnemu:

awk '
BEGIN { OFS=FS=":"; record=0 }

# spracovanie zaciatku bloku; nazvy premennych ukladam do attr[i]
{
 if ($0 ~ /^#/) {
  columns=split(substr($0,2),attr);
  #print"\n"; for(i in attr) print "attr["i"] = "attr[i]; #debug1
  next;
 }

# spracovanie riadkov s hodnotami; hodnoty ukladam do r[record, attr[i]]
 record++;
 numvalues=split($0,value);
  for(i=1;i<=numvalues;i++) {
   r[record SUBSEP attr[i]]= value[i];
   print "r ["record", "attr[i]"] = "r[record SUBSEP attr[i]];  #debug2
  }
}

END{
 print "-----" #debug3

 for (combined in r) {
  #print combined;   #debug4
  num=split(combined, separate, SUBSEP);
  #print separate[1], separate[2], r[separate[1] SUBSEP separate[2]]; #debug5
  # a co dal?
}

Vystupom z debug2 je

r [1, attr2] = value2r1
r [1, attr3] = value3r1
r [1, attr6] = value6r1
r [1, attr5] = value5r1
r [2, attr1] = value1r2
r [2, attr5] = value5r2
r [2, attr3] = value3r2
r [2, attr2] = value2r2
r [2, attr6] = value6r2
r [3, attr1] = value1r3
r [3, attr5] = value5r3
r [3, attr3] = value3r3
r [3, attr2] = value2r3
r [3, attr6] = value6r3
r [4, attr1] = value1r4
r [4, attr2] = value2r4
r [4, attr3] = value3r4
r [4, attr5] = value5r4

, takze verim, ze data mam rozparsovane a ulozene v asociativnom poli v poriadku.

Problemom pre mna je, ako z tohoto vyskladat vysledny vypis. Potrebujem nejako rozumne toto pole vyiterovat, no napada ma len klasicka konstrukcia: dva zanorene fory, ktora mi tu ale fungovat nebude, kedze nemam dva pouzitelne indexy.

Nejake napady? :)

Řešení dotazu:

Komentář #2 (chochi, 1 hlasů)

Nástroje: Začni sledovat (1) ?

Odpovědi

11.2.2013 10:06 l4m4
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky

Je to nutné dělat v awk?

Samozřejmě to je možné dělat v awk, ale jelikož je nutné si celý soubor rozparsovat do datových struktur, protože chceš mít ve výsledné hlavičce sjednocení všech atributů, udělal bych to v pythonu:

import sys

attrs = set()
data = []
for line in sys.stdin:
    line = line.strip()
    if not line:
        continue
    if line[0] == '#':
        currentattrs = line[1:].split(':')
        attrs.update(currentattrs)
    else:
        data.append(dict(zip(currentattrs, line.split(':'))))

keys = list(sorted(attrs))
print '#' + ':'.join(keys)
for row in data:
    print ':'.join(row.get(k, '') for k in keys)

11.2.2013 13:46 victor8 | skóre: 24 | blog: blog | Košice
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky

Vdaka za tip ako to spravit v Pythone.

Bohuzial je to nutne robit v awk, nakolko na servri kde to bude bezat nic ine okrem (plain) awk a sedu nemam a nainstalovat si tam python nemozem :)

Řešení 1× (victor8 (tazatel))

11.2.2013 10:55 chochi | skóre: 29 | Praha
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky

Zaklad je si pripravit pole se vsemi attributy. V awk napriklad takto:

BEGIN {
    OFS=FS=":"; record=0
}

# spracovanie zaciatku bloku; nazvy premennych ukladam do attr[i]
{
    if ($0 ~ /^#/) {
        columns = split(substr($0, 2), attr);
        for(c in attr) {
            # ulozim si vsechny attributy
            all[attr[c]] = attr[c];
        }
        next;
    }

    # spracovanie riadkov s hodnotami; hodnoty ukladam do r[record, attr[i]]
    record++;
    numvalues = split($0, value);
    for(i = 1; i <= numvalues; i++) {
        r[record, attr[i]] = value[i];
    }
}

END{
    nc = asort(all, sort);
    # vypis hlavicky
    ORS = "";
    print("#");
    ORS = ":";
    for (c = 1; c < nc; c++) {
        print(sort[c]);
    }
    ORS = "\n";
    print(sort[c]);
    # vypis obsahu
    for (l = 1; l <= record; l++) {
        ORS = ":";
        for (c = 1; c < nc; c++) {
            print(r[l, sort[c]]);
        }
        ORS = "\n";
        print(r[l, sort[c]]);
    }
}

Vysledek:

$ awk -f s.awk < in.txt 
#attr1:attr2:attr3:attr4:attr5:attr6:attr7:attr8
:value2r1:value3r1::value5r1:value6r1::
value1r2:value2r2:value3r2::value5r2:value6r2::
value1r3:value2r3:value3r3::value5r3:value6r3::
value1r4:value2r4:value3r4::value5r4:::

11.2.2013 13:13 l4m4
Rozbalit Rozbalit vše Re: awk - vypis dvojrozmerneho pola do tvaru mriezky

Ano, v awk to sice lze, ale...

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje