abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 11:22 | Bezpečnostní upozornění

    Úřad pro ochranu osobních údajů řeší desítky stížností na jednotné měsíční hlášení zaměstnavatele, které stát spustil počátkem dubna. Systém, jenž má firmám odlehčit od desítek formulářů, nejenže výrazně zatížil jejich účetní oddělení, ale docházelo v něm i k únikům osobních dat zaměstnanců k firmám, kde nepracovali. Podle ministerstva práce a sociálních věcí stála za problémem technická chyba. „Incident se týkal několika stovek

    … více »
    Ladislav Hagara | Komentářů: 3
    dnes 10:46 | Nová verze

    Byla vydána (𝕏, Bluesky) nová verze 22.0.0 open source webového aplikačního frameworku Angular (Wikipedie). Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    dnes 04:33 | Nová verze

    Vim Classic byl vydán ve verzi 8.3. Drew DeVault oznámil tento fork editoru Vim (verze 8.2.0148, tj. těsně před zavedením Vim9 skriptování) v březnu letošního roku. Důvodem forku bylo, že vývojáři editorů Vim a Neovim začali při vývoji využívat LLM.

    Ladislav Hagara | Komentářů: 5
    dnes 03:44 | Komunita

    Open source konference DevConf.CZ 2026 proběhne 18. a 19. června v Brně na FIT VUT. Publikován byl program a spuštěna byla registrace.

    Ladislav Hagara | Komentářů: 0
    včera 19:44 | Nová verze

    Společnost JetBrains uvolnila verzi 2 svého open-source velkého jazykového modelu (LLM) pro vývojáře Mellum.

    Ladislav Hagara | Komentářů: 0
    včera 14:44 | IT novinky

    Probíhá konference Microsoft Build 2026. Microsoft představuje své novinky: kvantový čip Majorana 2, Surface Laptop Ultra a Surface RTX Spark Dev Box s NVIDIA RTX Spark, Intelligent Terminal, Coreutils for Windows (fork Rust Coreutils), AI modely MAI, AI agenta Scout, platformu pro agent-first zařízení Project Solara, …

    Ladislav Hagara | Komentářů: 0
    včera 12:44 | Nová verze

    Google Chrome 149 byl prohlášen za stabilní. Nejnovější stabilní verze 149.0.7827.53 přináší řadu novinek. Podrobný přehled v poznámkách k vydání. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    včera 10:55 | Nová verze

    Pluto.jl, reaktivní notebook pro programovací jazyk Julia, dospěl do verze 1.0.

    Ladislav Hagara | Komentářů: 4
    2.6. 13:44 | Nová verze

    Byla vydána nová verze 12.0.0 vizuálního programovacího jazyka Snap! (Wikipedie) inspirovaného jazykem Scratch (Wikipedie). Přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 0
    2.6. 11:44 | IT novinky

    Počítačovou hru Gravity Circuit (ProtonDB) lze do 14. června do 19:00 získat na Steamu zdarma. Napořád.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (12%)
     (8%)
     (2%)
     (15%)
     (31%)
     (4%)
     (6%)
     (3%)
     (15%)
     (26%)
    Celkem 1817 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: sloučení několika souborů ve formátu *.csv

    9.5.2006 23:54 pavel
    sloučení několika souborů ve formátu *.csv
    Přečteno: 853×
    Dobrý den,rád bych poprosil o pomoc.

    Mám několik souborů ve formátu *.csv.

    Takto se mi soubory zobrazí v OpenOffice - Calc:

    Prvni_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    
    Druhy_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    
    Treti_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Potřebuji, aby mi vypadlo:
    
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Jinak musím otevřít všechny soubory v Calcu, porovnat, kopírovat, vložit atd. atd.atd...

    Poradil by mi někdo jak na to, popř. jaký příkaz na to použít?

    Odpovědi

    10.5.2006 01:22 tomas
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

    Berte to spíše jako návod, kudy se ubírat, než přesné řešení Vašeho problému:

    echo "title1\ttitle2\ttitle3\tdate" >union.csv

    sed -e 1d *_soubor.csv |sort |uniq >> union.csv

    10.5.2006 19:52 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Díky za odpověď, zkusím si to nastudovat.
    12.5.2006 10:08 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Jestli to dobře chápu, tak je potřeba vzít všechny datové řádky ze všech souborů, setřídit je podle data, vyházet duplicity a pak to všechno vypsat. Zkusil jsem to napsat v Pythonu. Nejvíc komplikací je s tím tříděním, protože je potřeba datum ve formátu
    9.1.2006
    
    převést na trojici
    (2006, 1, 9)
    
    Pak to teprve lze použít jako klíč pro sort(). Tady je ten program:
    #!/usr/bin/env python
    import sys, os, fileinput, re
    
    data = {}
    regexp = re.compile('^.*\s+(\d+)\.(\d+).(\d{4})\s+$')
    for line in fileinput.input():
      if fileinput.isfirstline():
        hlavicka = line
      try:
        dmy = regexp.search(line).groups()
        key = map(int, dmy)
        key.reverse()
        key = tuple(key)
        data[key] = line
      except AttributeError:
        pass
    
    keys = data.keys()
    keys.sort()
    sys.stdout.write(hlavicka)
    for key in keys:
      sys.stdout.write(data[key])
    
    Když se pustí s parametry
    Prvni_soubor.csv Druhy_soubor.csv Treti_soubor.csv
    
    tak vypíše tohle:
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Nevím, která hlavička tam patří, tak jsem ji vzal z posledního souboru.
    12.5.2006 12:14 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Ještě bych chtěl upřesnit ty data, přesný formát je:

    data1;data2;datan;2006-05-28 18:20:10

    data1;data2;datan;2006-05-28 18:20:10

    12.5.2006 12:41 xxl
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Nevím, jestli to správně chápu. Ale co použít něco takového:
    tail +2 Prvni_soubor.csv > data
    tail +2 Druhy_soubor.csv >> data
    tail +2 Treti_soubor.csv >> data
    
    echo "Nějaký_text - hlavička" > Vysledny_soubor.csv
    sort -t\; -gk4,4 data >> Vysledny_soubor.csv
    
    12.5.2006 13:18 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Takže já jsem zkusil:

    cat *.csv >spojeno.csv

    cat spojeno.csv|sort -n -u -t- -k1,1 >trideno_dle_datumu

    Funguje to, ale u toho -t mi nefunguje parametr středník, který tam měl být původně.

    Děkuji všem a hlavně prvnímu v této diskuzi, co mi odpověděl a navedl správným směrem.

    12.5.2006 20:06 tomas
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

    problém je v tom,že středník je ostrý znak shellu pro oddělování příkazů, které jsou na jednom řádku. Řešení je popsáno v příspěveku od neznámého xxl.

    Ještě si zkontrolujte, zda vám hlavičky neskončily na konci výsledného souboru (|tail). Řešením by pak bylo použít místo cat *.csv ,něco jako sed -s -e 1d *.csv

    13.5.2006 17:58 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Je to tak, ten příspěvek se středníkem jsem přehlédl (t\;).

    Hlavičky mi vychází dobře, ale ten příkaz si aspoň zkusím.

    15.5.2006 20:18 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Tak mi to jede dobře jen s jedním měsícem, pokud tam přidám soubory s dalším měsícem, třídí to špatně. Tak jsem zase na začátku, pomoc...
    15.5.2006 22:17 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Takže takto mi to třídí dobře:

    cat *.csv >spojeno.csv

    cat spojeno.csv |sort -u -t- -k2 >trideny.csv

    Už jsem myslel, že to nepůjde a vzdám to.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.