abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 11:22 | Bezpečnostní upozornění

    Úřad pro ochranu osobních údajů řeší desítky stížností na jednotné měsíční hlášení zaměstnavatele, které stát spustil počátkem dubna. Systém, jenž má firmám odlehčit od desítek formulářů, nejenže výrazně zatížil jejich účetní oddělení, ale docházelo v něm i k únikům osobních dat zaměstnanců k firmám, kde nepracovali. Podle ministerstva práce a sociálních věcí stála za problémem technická chyba. „Incident se týkal několika stovek

    … více »
    Ladislav Hagara | Komentářů: 0
    dnes 10:46 | Nová verze

    Byla vydána (𝕏, Bluesky) nová verze 22.0.0 open source webového aplikačního frameworku Angular (Wikipedie). Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    dnes 04:33 | Nová verze

    Vim Classic byl vydán ve verzi 8.3. Drew DeVault oznámil tento fork editoru Vim (verze 8.2.0148, tj. těsně před zavedením Vim9 skriptování) v březnu letošního roku. Důvodem forku bylo, že vývojáři editorů Vim a Neovim začali při vývoji využívat LLM.

    Ladislav Hagara | Komentářů: 2
    dnes 03:44 | Komunita

    Open source konference DevConf.CZ 2026 proběhne 18. a 19. června v Brně na FIT VUT. Publikován byl program a spuštěna byla registrace.

    Ladislav Hagara | Komentářů: 0
    včera 19:44 | Nová verze

    Společnost JetBrains uvolnila verzi 2 svého open-source velkého jazykového modelu (LLM) pro vývojáře Mellum.

    Ladislav Hagara | Komentářů: 0
    včera 14:44 | IT novinky

    Probíhá konference Microsoft Build 2026. Microsoft představuje své novinky: kvantový čip Majorana 2, Surface Laptop Ultra a Surface RTX Spark Dev Box s NVIDIA RTX Spark, Intelligent Terminal, Coreutils for Windows (fork Rust Coreutils), AI modely MAI, AI agenta Scout, platformu pro agent-first zařízení Project Solara, …

    Ladislav Hagara | Komentářů: 0
    včera 12:44 | Nová verze

    Google Chrome 149 byl prohlášen za stabilní. Nejnovější stabilní verze 149.0.7827.53 přináší řadu novinek. Podrobný přehled v poznámkách k vydání. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    včera 10:55 | Nová verze

    Pluto.jl, reaktivní notebook pro programovací jazyk Julia, dospěl do verze 1.0.

    Ladislav Hagara | Komentářů: 4
    2.6. 13:44 | Nová verze

    Byla vydána nová verze 12.0.0 vizuálního programovacího jazyka Snap! (Wikipedie) inspirovaného jazykem Scratch (Wikipedie). Přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 0
    2.6. 11:44 | IT novinky

    Počítačovou hru Gravity Circuit (ProtonDB) lze do 14. června do 19:00 získat na Steamu zdarma. Napořád.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (12%)
     (8%)
     (2%)
     (15%)
     (31%)
     (4%)
     (6%)
     (3%)
     (15%)
     (26%)
    Celkem 1816 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: zpracovani souboru awkem

    3.1.2006 16:42 Karel Borkovec | skóre: 28 | blog: HP_NX9010 | Tábor
    zpracovani souboru awkem
    Přečteno: 125×
    Dobrý den. Řeším následující problém: Mám takovýto výpis v souboru:
      uzivatel1 in                                       :             94M
      uzivatel1 out                                      :             30M
      uzivatel2 in                                       :            315M
      uzivatel2 out                                      :             45M
      uzivatel3 in                                       :            169M
      uzivatel3 out                                      :             50M
    
    Potřeboval bych dostat do souboru toto (tzn. sečíst odeslaná i přijatá data a zobrazit takto):
    uzivatel1;	124
    uzivatel2;	360
    uzivatel3;	219
    
    Zkoušel jsem to pomocí AWKu, ale hrozně v tom tápu. Neporadil by někdo prosím? Dekuji

    Odpovědi

    3.1.2006 18:26 razor | skóre: 33
    Rozbalit Rozbalit vše Re: zpracovani souboru awkem
    Pokud by si to chtěl v pythonu, tak by to šlo nějak takhle (netvrdím, že by to nešlo napsat lépe :-) )
    import re
    
    input = file('souborA', 'r')
    output = file('souborB', 'w')
    
    result = {}
    try:
    	for line in input.readlines():
    		splitted = re.split('\s', line)
    		key = splitted[0]
    		value = int(re.split('\D', splitted[3])[0])
    		if result.has_key(key):
    			result[key] = result[key] + value
    		else:
    			result[key] = value
    	for pairs in result.items():
    		output.write(pairs[0] + ';\t' + str(pairs[1]) + '\n')
    finally:
        input.close()
        output.close()
    3.1.2006 20:37 Bones | skóre: 15 | blog:
    Rozbalit Rozbalit vše Re: zpracovani souboru awkem

    AWK neumim (ale chci se ho nekdy naucit), tak ti alespon dam linky na dokumentaci.

    Ceska: Tam najdes dalsi odkazy.
    Anglicka: manualova stranka, info dokument, ci GAWK manual
    3.1.2006 20:55 Franta Hanzlik
    Rozbalit Rozbalit vše Re: zpracovani souboru awkem
    Nepopisujete presne strukturu vstupnich dat, takze zhruba :
    awk 'BEGIN{MU="";SUM=0}{SUM1=gensub(/[^0-9]$/,"",1,$NF) + 0; if (MU == $1 || MU == ""){MU=$1;SUM+=SUM1} else {printf "%s - %i\n",MU,SUM; SUM=SUM1;MU=$1}}END{printf "%s - %i\n",MU,SUM}'
    
    - nebo udelat awk script (a chmod +x) :
    #!/bin/awk -f
    
    BEGIN{MU="";SUM=0}      # MU: Minuly Uzivatel, SUM: jeho soucet dat
    {SUM1=gensub(/[^0-9]$/,"",1,$NF) + 0    # na konci posledni polozky (=objem) urizni vse mimo cislice (tady rezu 'M')
    if (MU == $1 || MU == ""){      # uzivatel na predchozi radce je stejny jako na aktualni nebo zacinam
            MU=$1;SUM+=SUM1
    } else {
            printf "%s - %i\n",MU,SUM; SUM=SUM1;MU=$1} #zmena, vypisuji a minuly=aktualni
    }
    END{printf "%s - %i\n",MU,SUM} # a dotisk posledniho po zpracovani souboru
    
    4.1.2006 01:41 Andrej | skóre: 51 | blog: Republic of Mordor
    Rozbalit Rozbalit vše Proč AWK?

    AWK je velmi dobrá věc, ale je to trochu jednodušší s drobnou pomocí sedu:


    cat vstup.txt | \
    sed 's/ *\([^ \t]*\).*:[ \t]*\([0-9]*\).*/\1;\t\2/' | \
    awk '{ if ( par % 2 ) { sum += $2; print $1 "\t" sum; } else { sum = $2; } par++; }' \
    > vystup.txt


    Tady se jasně dělí úlohy: sed edituje, awk počítá. Doufám, že to takhle stačí a že to pomůže. Pokud potřebujete ještě něco jiného, stačí říct. :-)

    4.1.2006 02:22 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: zpracovani souboru awkem
    To množství dat bude vždycky v megabajtech? Pokud ne, zde máte další řešení v pythonu:
    #!/usr/bin/env python
    import re
    
    infile = open('infile.dat')
    regexp = re.compile(r'^\s+(\S+) (in|out)\s+:\s+(\d+)(.*)')
    result={}
    for line in infile.xreadlines():
      user, direction, amount, unit = re.search(regexp, line).groups()
      amount = int(amount)
    
      if 'G' in unit:
        amount *= 1024*1024*1024
      elif 'M' in unit:
        amount *= 1024*1024
      elif 'k' in unit:
        amount *= 1024
    
      try:
        result[user] += amount
      except KeyError:
        result[user] = amount
    
    infile.close()
    
    outfile = open('outfile.dat', 'w')
    for user, amount in result.items():
      outfile.write('%s;\t%d\n' %(user, amount))
    outfile.close()
    
    A vůbec - tohle by přece měl dělat ten původní program, který vygeneroval ten soubor. Nebude lepší spíš zasáhnout do zdrojáku než parsovat výstup? Hrozí nebezpečí, že se časem změní formát nebo že bude potřeba nějaká informace, kterou původní program měl, ale nevypsal.
    4.1.2006 16:19 Karel Borkovec | skóre: 28 | blog: HP_NX9010 | Tábor
    Rozbalit Rozbalit vše Re: zpracovani souboru awkem
    Možná by stálo ze to zasáhnout do zdrojáků toho programu (ipac-ng), ale to už je totálně nad moje znalosti...
    4.1.2006 16:19 Karel Borkovec | skóre: 28 | blog: HP_NX9010 | Tábor
    Rozbalit Rozbalit vše Re: zpracovani souboru awkem
    Všem mockrát děkuji!

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.