abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 12:55 | Nová verze

    CiviCRM (Wikipedie) bylo vydáno v nové verzi 6.14.0. Podrobnosti o nových funkcích a opravách najdete na release stránce. CiviCRM je robustní open-source CRM systém navržený speciálně pro neziskové organizace, spolky a občanské iniciativy. Projekt je napsán v jazyce PHP a licencován pod GNU Affero General Public License (AGPLv3). Český překlad má nyní 45 % přeložených řetězců a přibližuje se milníku 50 %. Potřebujeme vaši pomoc, abychom se dostali dál. Pokud máte chuť přispět překladem nebo korekturou, přidejte se na platformu Transifex.

    jardaIT | Komentářů: 0
    dnes 12:22 | Bezpečnostní upozornění

    Další lokální zranitelností Linuxu je ssh-keysign-pwn. Uživatel si může přečíst obsah souborů, ke kterým má právo ke čtení pouze root, například soubory s SSH klíči nebo /etc/shadow. V upstreamu již opraveno [oss-security mailing list].

    Ladislav Hagara | Komentářů: 0
    včera 17:22 | Komunita

    Singularity (YouTube) je nejnovější otevřený film od Blender Studia. Jedná se o jejich první 4K HDR film.

    Ladislav Hagara | Komentářů: 0
    včera 16:55 | Zajímavý software

    Vyšla hra Život Není Krásný: Poslední Exekuce (Steam, ProtonDB). Kreslená point & click adventura ze staré školy plná černého humoru a nekorektního násilí. Vžijte se do role zpustlého exekutora Vladimíra Brehowského a projděte s ním jeho poslední pracovní den. Hra volně navazuje na sérii Život Není Krásný.

    Ladislav Hagara | Komentářů: 22
    včera 14:00 | Zajímavý projekt

    Společnost Red Hat představila Fedora Hummingbird, tj. linuxovou distribuci s nativním kontejnerovým designem určenou pro vývojáře využívající AI agenty.

    Pinhead | Komentářů: 6
    včera 02:22 | Zajímavý software

    Hru The Legend of Zelda: Twilight Princess od společnosti Nintendo si lze nově díky projektu Dusklight (původně Dusk) a reverznímu inženýrství zahrát i na počítačích a mobilních zařízeních. Vyžadována je kopie původní hry (textury, modely, hudba, zvukové efekty, …). Ukázka na YouTube. Projekt byl zahájen v srpnu 2020.

    Ladislav Hagara | Komentářů: 0
    včera 01:11 | Nová verze

    Byla vydána nová major verze 29.0 programovacího jazyka Erlang (Wikipedie) a související platformy OTP (Open Telecom Platform, Wikipedie). Detailní přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 0
    13.5. 21:22 | Bezpečnostní upozornění

    Po zranitelnostech Copy Fail a Dirty Frag přichází zranitelnost Fragnesia. Další lokální eskalace práv na Linuxu. Zatím v upstreamu neopravena. Přiřazeno ji bylo CVE-2026-46300.

    Ladislav Hagara | Komentářů: 1
    13.5. 14:00 | Komunita

    Sovereign Tech Agency (Wikipedie) prostřednictvím svého fondu Sovereign Tech Fund podpoří KDE částkou 1 285 200 eur.

    Ladislav Hagara | Komentářů: 11
    13.5. 12:55 | IT novinky

    Google na včerejší akci The Android Show | I/O Edition 2026 (YouTube) představil celou řadu novinek: Gemini Intelligence, notebooky Googlebook, novou generaci Android Auto, …

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (13%)
     (8%)
     (2%)
     (14%)
     (31%)
     (4%)
     (6%)
     (3%)
     (16%)
     (26%)
    Celkem 1632 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Dotaz: sloučení několika souborů ve formátu *.csv

    9.5.2006 23:54 pavel
    sloučení několika souborů ve formátu *.csv
    Přečteno: 849×
    Dobrý den,rád bych poprosil o pomoc.

    Mám několik souborů ve formátu *.csv.

    Takto se mi soubory zobrazí v OpenOffice - Calc:

    Prvni_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    
    Druhy_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    
    Treti_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Potřebuji, aby mi vypadlo:
    
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Jinak musím otevřít všechny soubory v Calcu, porovnat, kopírovat, vložit atd. atd.atd...

    Poradil by mi někdo jak na to, popř. jaký příkaz na to použít?

    Odpovědi

    10.5.2006 01:22 tomas
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

    Berte to spíše jako návod, kudy se ubírat, než přesné řešení Vašeho problému:

    echo "title1\ttitle2\ttitle3\tdate" >union.csv

    sed -e 1d *_soubor.csv |sort |uniq >> union.csv

    10.5.2006 19:52 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Díky za odpověď, zkusím si to nastudovat.
    12.5.2006 10:08 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Jestli to dobře chápu, tak je potřeba vzít všechny datové řádky ze všech souborů, setřídit je podle data, vyházet duplicity a pak to všechno vypsat. Zkusil jsem to napsat v Pythonu. Nejvíc komplikací je s tím tříděním, protože je potřeba datum ve formátu
    9.1.2006
    
    převést na trojici
    (2006, 1, 9)
    
    Pak to teprve lze použít jako klíč pro sort(). Tady je ten program:
    #!/usr/bin/env python
    import sys, os, fileinput, re
    
    data = {}
    regexp = re.compile('^.*\s+(\d+)\.(\d+).(\d{4})\s+$')
    for line in fileinput.input():
      if fileinput.isfirstline():
        hlavicka = line
      try:
        dmy = regexp.search(line).groups()
        key = map(int, dmy)
        key.reverse()
        key = tuple(key)
        data[key] = line
      except AttributeError:
        pass
    
    keys = data.keys()
    keys.sort()
    sys.stdout.write(hlavicka)
    for key in keys:
      sys.stdout.write(data[key])
    
    Když se pustí s parametry
    Prvni_soubor.csv Druhy_soubor.csv Treti_soubor.csv
    
    tak vypíše tohle:
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Nevím, která hlavička tam patří, tak jsem ji vzal z posledního souboru.
    12.5.2006 12:14 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Ještě bych chtěl upřesnit ty data, přesný formát je:

    data1;data2;datan;2006-05-28 18:20:10

    data1;data2;datan;2006-05-28 18:20:10

    12.5.2006 12:41 xxl
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Nevím, jestli to správně chápu. Ale co použít něco takového:
    tail +2 Prvni_soubor.csv > data
    tail +2 Druhy_soubor.csv >> data
    tail +2 Treti_soubor.csv >> data
    
    echo "Nějaký_text - hlavička" > Vysledny_soubor.csv
    sort -t\; -gk4,4 data >> Vysledny_soubor.csv
    
    12.5.2006 13:18 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Takže já jsem zkusil:

    cat *.csv >spojeno.csv

    cat spojeno.csv|sort -n -u -t- -k1,1 >trideno_dle_datumu

    Funguje to, ale u toho -t mi nefunguje parametr středník, který tam měl být původně.

    Děkuji všem a hlavně prvnímu v této diskuzi, co mi odpověděl a navedl správným směrem.

    12.5.2006 20:06 tomas
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

    problém je v tom,že středník je ostrý znak shellu pro oddělování příkazů, které jsou na jednom řádku. Řešení je popsáno v příspěveku od neznámého xxl.

    Ještě si zkontrolujte, zda vám hlavičky neskončily na konci výsledného souboru (|tail). Řešením by pak bylo použít místo cat *.csv ,něco jako sed -s -e 1d *.csv

    13.5.2006 17:58 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Je to tak, ten příspěvek se středníkem jsem přehlédl (t\;).

    Hlavičky mi vychází dobře, ale ten příkaz si aspoň zkusím.

    15.5.2006 20:18 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Tak mi to jede dobře jen s jedním měsícem, pokud tam přidám soubory s dalším měsícem, třídí to špatně. Tak jsem zase na začátku, pomoc...
    15.5.2006 22:17 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Takže takto mi to třídí dobře:

    cat *.csv >spojeno.csv

    cat spojeno.csv |sort -u -t- -k2 >trideny.csv

    Už jsem myslel, že to nepůjde a vzdám to.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.