abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 02:33 | Nová verze

    Byla vydána nová verze 6.1 linuxové distribuce Lakka (Wikipedie), jež umožňuje transformovat podporované počítače v herní konzole. Nejnovější Lakka přichází s RetroArchem 1.22.2.

    Ladislav Hagara | Komentářů: 0
    dnes 02:11 | Nová verze

    Matematický software GNU Octave byl vydán ve verzi 11.1.0. Podrobnosti v poznámkách k vydání. Vedle menších změn rozhraní jsou jako obvykle zahrnuta také výkonnostní vylepšení a zlepšení kompatibility s Matlabem.

    |🇵🇸 | Komentářů: 0
    včera 21:44 | Nová verze

    Weston, referenční implementace kompozitoru pro Wayland, byl vydán ve verzi 15.0.0. Přehled novinek v příspěvku na blogu společnosti Collabora. Vypíchnout lze Lua shell umožňující psát správu oken v jazyce Lua.

    Ladislav Hagara | Komentářů: 0
    včera 21:11 | Nová verze

    Organizace Apache Software Foundation (ASF) vydala verzi 29 integrovaného vývojového prostředí a vývojové platformy napsané v Javě NetBeans (Wikipedie). Přehled novinek na GitHubu. Instalovat lze také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 3
    včera 18:22 | IT novinky

    Ústavní soud na svých webových stránkách i v databázi NALUS (NÁLezy a USnesení Ústavního soudu) představil novou verzi chatbota využívajícího umělou inteligenci. Jeho posláním je usnadnit veřejnosti orientaci v rozsáhlé judikatuře Ústavního soudu a pomoci jí s vyhledáváním informací i na webových stránkách soudu, a to i v jiných jazycích. Jde o první nasazení umělé inteligence v rámci webových stránek a databází judikatury českých soudů.

    Ladislav Hagara | Komentářů: 13
    včera 13:00 | Nová verze

    Byla vydána nová verze 10.1 z Debianu vycházející linuxové distribuce DietPi pro (nejenom) jednodeskové počítače. Přehled novinek v poznámkách k vydání. Vypíchnuta je podpora NanoPi Zero2 a balíček WhoDB.

    Ladislav Hagara | Komentářů: 0
    včera 12:44 | Komunita

    Konference Otvorený softvér vo vzdelávaní, výskume a v IT riešeniach OSSConf 2026 proběhne od 1. do 3. července 2026 na Žilinské univerzita v Žilině: "Cieľom našej konferencie je poskytnúť priestor pre informovanie o novinkách vo vývoji otvoreného softvéru a otvorených technológií, o možnostiach využitia týchto nástrojov vo vede a vzdelávaní a taktiež poskytnúť priestor pre neformálne priateľské stretnutie užívateľov a priaznivcov

    … více »
    Ladislav Hagara | Komentářů: 0
    včera 12:22 | Pozvánky

    Korespondenční seminář z programování (KSP) pražského Matfyzu pořádá i letos jarní soustředění pro začátečníky. Zváni jsou všichni středoškoláci a starší základoškoláci, kteří se chtějí naučit programovat, lépe uvažovat o informatických úlohách a poznat nové podobně smýšlející kamarády. Úplným začátečníkům bude určen kurz základů programování a kurz základních algoritmických dovedností, pokročilejším nabídneme různorodé

    … více »
    skywalqer | Komentářů: 1
    22.2. 04:11 | Komunita

    Fedora je od 10. února dostupná v Sýrii. Sýrie vypadla ze seznamu embargovaných zemí a Fedora Infrastructure Team mohl odblokovat syrské IP adresy.

    Ladislav Hagara | Komentářů: 22
    22.2. 03:44 | Zajímavý projekt

    Ministerstvo zahraničí Spojených států amerických vyvíjí online portál Freedom.gov, který umožní nejenom uživatelům v Evropě přístup k obsahu blokovanému jejich vládami. Portál bude patrně obsahovat VPN funkci maskující uživatelský provoz tak, aby se jevil jako pocházející z USA. Projekt měl být původně představen již na letošní Mnichovské bezpečnostní konferenci, ale jeho spuštění bylo odloženo.

    NUKE GAZA! 🎆 | Komentářů: 29
    Které desktopové prostředí na Linuxu používáte?
     (18%)
     (6%)
     (0%)
     (11%)
     (27%)
     (2%)
     (5%)
     (1%)
     (12%)
     (26%)
    Celkem 946 hlasů
     Komentářů: 25, poslední 3.2. 19:50
    Rozcestník

    Dotaz: sloučení několika souborů ve formátu *.csv

    9.5.2006 23:54 pavel
    sloučení několika souborů ve formátu *.csv
    Přečteno: 843×
    Dobrý den,rád bych poprosil o pomoc.

    Mám několik souborů ve formátu *.csv.

    Takto se mi soubory zobrazí v OpenOffice - Calc:

    Prvni_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    
    Druhy_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    
    Treti_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Potřebuji, aby mi vypadlo:
    
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Jinak musím otevřít všechny soubory v Calcu, porovnat, kopírovat, vložit atd. atd.atd...

    Poradil by mi někdo jak na to, popř. jaký příkaz na to použít?

    Odpovědi

    10.5.2006 01:22 tomas
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

    Berte to spíše jako návod, kudy se ubírat, než přesné řešení Vašeho problému:

    echo "title1\ttitle2\ttitle3\tdate" >union.csv

    sed -e 1d *_soubor.csv |sort |uniq >> union.csv

    10.5.2006 19:52 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Díky za odpověď, zkusím si to nastudovat.
    12.5.2006 10:08 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Jestli to dobře chápu, tak je potřeba vzít všechny datové řádky ze všech souborů, setřídit je podle data, vyházet duplicity a pak to všechno vypsat. Zkusil jsem to napsat v Pythonu. Nejvíc komplikací je s tím tříděním, protože je potřeba datum ve formátu
    9.1.2006
    
    převést na trojici
    (2006, 1, 9)
    
    Pak to teprve lze použít jako klíč pro sort(). Tady je ten program:
    #!/usr/bin/env python
    import sys, os, fileinput, re
    
    data = {}
    regexp = re.compile('^.*\s+(\d+)\.(\d+).(\d{4})\s+$')
    for line in fileinput.input():
      if fileinput.isfirstline():
        hlavicka = line
      try:
        dmy = regexp.search(line).groups()
        key = map(int, dmy)
        key.reverse()
        key = tuple(key)
        data[key] = line
      except AttributeError:
        pass
    
    keys = data.keys()
    keys.sort()
    sys.stdout.write(hlavicka)
    for key in keys:
      sys.stdout.write(data[key])
    
    Když se pustí s parametry
    Prvni_soubor.csv Druhy_soubor.csv Treti_soubor.csv
    
    tak vypíše tohle:
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Nevím, která hlavička tam patří, tak jsem ji vzal z posledního souboru.
    12.5.2006 12:14 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Ještě bych chtěl upřesnit ty data, přesný formát je:

    data1;data2;datan;2006-05-28 18:20:10

    data1;data2;datan;2006-05-28 18:20:10

    12.5.2006 12:41 xxl
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Nevím, jestli to správně chápu. Ale co použít něco takového:
    tail +2 Prvni_soubor.csv > data
    tail +2 Druhy_soubor.csv >> data
    tail +2 Treti_soubor.csv >> data
    
    echo "Nějaký_text - hlavička" > Vysledny_soubor.csv
    sort -t\; -gk4,4 data >> Vysledny_soubor.csv
    
    12.5.2006 13:18 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Takže já jsem zkusil:

    cat *.csv >spojeno.csv

    cat spojeno.csv|sort -n -u -t- -k1,1 >trideno_dle_datumu

    Funguje to, ale u toho -t mi nefunguje parametr středník, který tam měl být původně.

    Děkuji všem a hlavně prvnímu v této diskuzi, co mi odpověděl a navedl správným směrem.

    12.5.2006 20:06 tomas
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

    problém je v tom,že středník je ostrý znak shellu pro oddělování příkazů, které jsou na jednom řádku. Řešení je popsáno v příspěveku od neznámého xxl.

    Ještě si zkontrolujte, zda vám hlavičky neskončily na konci výsledného souboru (|tail). Řešením by pak bylo použít místo cat *.csv ,něco jako sed -s -e 1d *.csv

    13.5.2006 17:58 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Je to tak, ten příspěvek se středníkem jsem přehlédl (t\;).

    Hlavičky mi vychází dobře, ale ten příkaz si aspoň zkusím.

    15.5.2006 20:18 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Tak mi to jede dobře jen s jedním měsícem, pokud tam přidám soubory s dalším měsícem, třídí to špatně. Tak jsem zase na začátku, pomoc...
    15.5.2006 22:17 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Takže takto mi to třídí dobře:

    cat *.csv >spojeno.csv

    cat spojeno.csv |sort -u -t- -k2 >trideny.csv

    Už jsem myslel, že to nepůjde a vzdám to.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.