abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 19:55 | Nová verze

    Typst byl vydán ve verzi 0.14. Jedná se o rozšiřitelný značkovací jazyk a překladač pro vytváření dokumentů včetně odborných textů s matematickými vzorci, diagramy či bibliografií.

    Ladislav Hagara | Komentářů: 0
    včera 13:33 | Bezpečnostní upozornění

    Specialisté společnosti ESET zaznamenali útočnou kampaň, která cílí na uživatele a uživatelky v Česku a na Slovensku. Útočníci po telefonu zmanipulují oběť ke stažení falešné aplikace údajně od České národní banky (ČNB) nebo Národní banky Slovenska (NBS), přiložení platební karty k telefonu a zadání PINu. Malware poté v reálném čase přenese data z karty útočníkovi, který je bezkontaktně zneužije u bankomatu nebo na platebním terminálu.

    Ladislav Hagara | Komentářů: 7
    včera 13:22 | Upozornění

    V Ubuntu 25.10 byl balíček základních nástrojů gnu-coreutils nahrazen balíčkem rust-coreutils se základními nástroji přepsanými do Rustu. Ukázalo se, že nový "date" znefunkčnil automatickou aktualizaci. Pro obnovu je nutno balíček rust-coreutils manuálně aktualizovat.

    Ladislav Hagara | Komentářů: 4
    včera 04:55 | Komunita

    VST 3 je nově pod licencí MIT. S verzí 3.8.0 proběhlo přelicencování zdrojových kódů z licencí "Proprietary Steinberg VST3 License" a "General Public License (GPL) Version 3". VST (Virtual Studio Technology, Wikipedie) je softwarové rozhraní pro komunikaci mezi hostitelským programem a zásuvnými moduly (pluginy), kde tyto moduly slouží ke generování a úpravě digitálního audio signálu.

    Ladislav Hagara | Komentářů: 1
    včera 03:22 | Nová verze

    Open source 3D herní a simulační engine Open 3D Engine (O3DE) byl vydán v nové verzi 25.10. Podrobný přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    23.10. 20:11 | Komunita

    V Londýně probíhá dvoudenní Ubuntu Summit 25.10. Na programu je řada zajímavých přednášek. Zhlédnout je lze také na YouTube (23. 10. a 24. 10.).

    Ladislav Hagara | Komentářů: 0
    23.10. 13:22 | Nová verze

    Gemini CLI umožňuje používání AI Gemini přímo v terminálu. Vydána byla verze 0.10.0.

    Ladislav Hagara | Komentářů: 0
    23.10. 12:55 | Pozvánky

    Konference OpenAlt 2025 proběhne již příští víkend 1. a 2. listopadu v Brně. Nabídne přibližně 80 přednášek a workshopů rozdělených do 7 tematických tracků. Program se může ještě mírně měnit až do samotné konference, a to s ohledem na opožděné úpravy abstraktů i případné podzimní virózy. Díky partnerům je vstup na konferenci zdarma. Registrace není nutná. Vyplnění formuláře však pomůže s lepším plánováním dalších ročníků konference.

    Ladislav Hagara | Komentářů: 0
    23.10. 05:33 | IT novinky

    Samsung představil headset Galaxy XR se 4K Micro-OLED displeji, procesorem Snapdragon XR2+ Gen 2, 16 GB RAM, 256 GB úložištěm, operačním systémem Android XR a Gemini AI.

    Ladislav Hagara | Komentářů: 2
    23.10. 05:22 | Nová verze

    Před konferencí Next.js Conf 2025 bylo oznámeno vydání nové verze 16 open source frameworku Next.js (Wikipedie) pro psaní webových aplikací v Reactu. Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (48%)
     (20%)
     (20%)
     (24%)
     (18%)
     (21%)
     (18%)
     (18%)
    Celkem 268 hlasů
     Komentářů: 14, poslední 14.10. 09:04
    Rozcestník

    Dotaz: sloučení několika souborů ve formátu *.csv

    9.5.2006 23:54 pavel
    sloučení několika souborů ve formátu *.csv
    Přečteno: 841×
    Dobrý den,rád bych poprosil o pomoc.

    Mám několik souborů ve formátu *.csv.

    Takto se mi soubory zobrazí v OpenOffice - Calc:

    Prvni_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    
    Druhy_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    
    Treti_soubor.csv:
    Nějaký_text - hlavička
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Potřebuji, aby mi vypadlo:
    
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Jinak musím otevřít všechny soubory v Calcu, porovnat, kopírovat, vložit atd. atd.atd...

    Poradil by mi někdo jak na to, popř. jaký příkaz na to použít?

    Odpovědi

    10.5.2006 01:22 tomas
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

    Berte to spíše jako návod, kudy se ubírat, než přesné řešení Vašeho problému:

    echo "title1\ttitle2\ttitle3\tdate" >union.csv

    sed -e 1d *_soubor.csv |sort |uniq >> union.csv

    10.5.2006 19:52 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Díky za odpověď, zkusím si to nastudovat.
    12.5.2006 10:08 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Jestli to dobře chápu, tak je potřeba vzít všechny datové řádky ze všech souborů, setřídit je podle data, vyházet duplicity a pak to všechno vypsat. Zkusil jsem to napsat v Pythonu. Nejvíc komplikací je s tím tříděním, protože je potřeba datum ve formátu
    9.1.2006
    
    převést na trojici
    (2006, 1, 9)
    
    Pak to teprve lze použít jako klíč pro sort(). Tady je ten program:
    #!/usr/bin/env python
    import sys, os, fileinput, re
    
    data = {}
    regexp = re.compile('^.*\s+(\d+)\.(\d+).(\d{4})\s+$')
    for line in fileinput.input():
      if fileinput.isfirstline():
        hlavicka = line
      try:
        dmy = regexp.search(line).groups()
        key = map(int, dmy)
        key.reverse()
        key = tuple(key)
        data[key] = line
      except AttributeError:
        pass
    
    keys = data.keys()
    keys.sort()
    sys.stdout.write(hlavicka)
    for key in keys:
      sys.stdout.write(data[key])
    
    Když se pustí s parametry
    Prvni_soubor.csv Druhy_soubor.csv Treti_soubor.csv
    
    tak vypíše tohle:
    Nějaký_text - hlavička
    data1 data2 datan 1.1.2006
    data1 data2 datan 2.1.2006
    data1 data2 datan 3.1.2006
    data1 data2 datan 4.1.2006
    data1 data2 datan 5.1.2006
    data1 data2 datan 6.1.2006
    data1 data2 datan 7.1.2006
    data1 data2 datan 8.1.2006
    data1 data2 datan 9.1.2006
    data1 data2 datan 10.1.2006
    
    Nevím, která hlavička tam patří, tak jsem ji vzal z posledního souboru.
    12.5.2006 12:14 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Ještě bych chtěl upřesnit ty data, přesný formát je:

    data1;data2;datan;2006-05-28 18:20:10

    data1;data2;datan;2006-05-28 18:20:10

    12.5.2006 12:41 xxl
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Nevím, jestli to správně chápu. Ale co použít něco takového:
    tail +2 Prvni_soubor.csv > data
    tail +2 Druhy_soubor.csv >> data
    tail +2 Treti_soubor.csv >> data
    
    echo "Nějaký_text - hlavička" > Vysledny_soubor.csv
    sort -t\; -gk4,4 data >> Vysledny_soubor.csv
    
    12.5.2006 13:18 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Takže já jsem zkusil:

    cat *.csv >spojeno.csv

    cat spojeno.csv|sort -n -u -t- -k1,1 >trideno_dle_datumu

    Funguje to, ale u toho -t mi nefunguje parametr středník, který tam měl být původně.

    Děkuji všem a hlavně prvnímu v této diskuzi, co mi odpověděl a navedl správným směrem.

    12.5.2006 20:06 tomas
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

    problém je v tom,že středník je ostrý znak shellu pro oddělování příkazů, které jsou na jednom řádku. Řešení je popsáno v příspěveku od neznámého xxl.

    Ještě si zkontrolujte, zda vám hlavičky neskončily na konci výsledného souboru (|tail). Řešením by pak bylo použít místo cat *.csv ,něco jako sed -s -e 1d *.csv

    13.5.2006 17:58 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Je to tak, ten příspěvek se středníkem jsem přehlédl (t\;).

    Hlavičky mi vychází dobře, ale ten příkaz si aspoň zkusím.

    15.5.2006 20:18 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Tak mi to jede dobře jen s jedním měsícem, pokud tam přidám soubory s dalším měsícem, třídí to špatně. Tak jsem zase na začátku, pomoc...
    15.5.2006 22:17 pavel
    Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv
    Takže takto mi to třídí dobře:

    cat *.csv >spojeno.csv

    cat spojeno.csv |sort -u -t- -k2 >trideny.csv

    Už jsem myslel, že to nepůjde a vzdám to.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.