Inzerujte na AbcPráce.cz od 950 Kč

napište » Zprávičky

dnes 20:00 | IT novinky

Dnes jde do prodeje zařízení Steam Machine. Steam Machine 512 GB za 1 039 EUR a Steam Machine 2 TB za 1 359 EUR. Do čtvrtka 25. června do 19:00 se lze zapsat na seznamy. Ty budou jednorázově náhodně slosovány, čímž bude určeno pořadí rezervací a čekacích listin.

Ladislav Hagara | Komentářů: 0

OpenMW 0.51.0

dnes 14:44 | Nová verze

Vývojáři OpenMW (Wikipedie) oznámili vydání verze 0.51.0 této svobodné implementace enginu pro hru The Elder Scrolls III: Morrowind. Přehled novinek v oznámení o vydání a také na YouTube a PeerTube.

Ladislav Hagara | Komentářů: 0

ScummVM 2026.3.0 "Carousels & Killer Whales"

dnes 13:33 | Nová verze

Byla vydána nová verze 2026.3.0 "Carousels & Killer Whales" svobodného softwaru ScummVM (Wikipedie) umožňujícího bezproblémový běh mnoha klasických adventur na zařízeních, pro které nebyly nikdy určeny. Přehled novinek v poznámkách k vydání a na GitHubu.

Ladislav Hagara | Komentářů: 1

Vypršení platnosti Microsoft certifikátu v UEFI

dnes 12:22 | IT novinky

Tento týden (24. a 27. června) vyprší platnost Microsoft certifikátu v UEFI vydaných v roce 2011. Nové certifikáty byly vydány v roce 2023. Kdo na počítačích, i virtuálních, používá zabezpečené spouštění (Secure Boot), měl by si ověřit, že má certifikáty aktualizovány, viz např. články na Red Hat nebo Fedora. Pro stávající systémy se nic nemění. Nadále se budou normálně spouštět. Zavaděče podepsané pouze klíčem z 2023 se ale na počítačích s pouze certifikátem 2011 nespustí. Ve Fedoře je zavaděč shim ve verzi 16.1-6 podepsán klíči 2011 i 2023.

Ladislav Hagara | Komentářů: 4

Mobilní Datovka pro Linux

včera 19:55 | Zajímavý software

Uživatelé mobilních telefonů s Linuxem si nyní mohou nainstalovat aplikaci Mobilní Datovka. Díky tomu je přístup k datovým schránkám dostupný i na zařízeních s mobilními linuxovými distribucemi, jako jsou například Mobian, NixOS Mobile, pmOS atd. Aplikace je dostupná na Flathubu.

David Heidelberg | Komentářů: 3

Doporučení SFC pro používání generativní AI při přispívání do FOSS

včera 13:33 | Komunita

Software Freedom Conservancy v novém dokumentu shrnuje doporučení, jak přistupovat ke generativní AI založené na LLM při přispívání do svobodného a open-source softwaru. Mimo jiné vyzývá k obezřetnosti, transparentnosti a revizi generovaného kódu člověkem.

|🇵🇸 | Komentářů: 9

darktable 5.6.0

včera 13:22 | Nová verze

Byla vydána nová verze 5.6.0 programu na úpravu digitálních fotografií darktable (Wikipedie).

Ladislav Hagara | Komentářů: 0

Týden v GNOME a Týden v KDE Plasma (20. června 2026)

20.6. 20:11 | Komunita

Na čem aktuálně pracují vývojáři GNOME a KDE Plasma? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE Plasma. V Týdnu v GNOME je zmíněn flatpak balíček pro GIMP 0.54.1 z roku 1996. Jedná se o poslední verzi GIMPu postavenou nad toolkitem Motif.

Ladislav Hagara | Komentářů: 0

Home Assistant Operating System 18.0

20.6. 19:11 | Nová verze

Home Assistant Operating System, tj. linuxová distribuce optimalizována pro hostování Home Assistanta a jeho aplikací, byl vydán v nové major verzi 18.0.

Ladislav Hagara | Komentářů: 4

Z jádra Linux byla odstraněna funkce strncpy()

20.6. 18:11 | Komunita

Po šestiletém úsilí byla z jádra Linux odstraněna funkce strncpy(). Všechna předchozí volání této funkce byla převedena na bezpečnější alternativy.

Ladislav Hagara | Komentářů: 1

Centrum | Napsat | Starší

navrhněte » Anketa

Komentářů: 30, poslední 3.4. 20:20

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / sloučení několika souborů ve formátu *.csv

Štítky: programování, Python, sed

Dotaz: sloučení několika souborů ve formátu *.csv

9.5.2006 23:54 pavel
sloučení několika souborů ve formátu *.csv

Přečteno: 858×

Odpovědět | Admin

Dobrý den,rád bych poprosil o pomoc.

Mám několik souborů ve formátu *.csv.

Takto se mi soubory zobrazí v OpenOffice - Calc:

Prvni_soubor.csv:
Nějaký_text - hlavička
data1 data2 datan 1.1.2006
data1 data2 datan 2.1.2006
data1 data2 datan 3.1.2006
data1 data2 datan 4.1.2006
data1 data2 datan 5.1.2006

Druhy_soubor.csv:
Nějaký_text - hlavička
data1 data2 datan 3.1.2006
data1 data2 datan 4.1.2006
data1 data2 datan 5.1.2006
data1 data2 datan 6.1.2006
data1 data2 datan 7.1.2006

Treti_soubor.csv:
Nějaký_text - hlavička
data1 data2 datan 4.1.2006
data1 data2 datan 5.1.2006
data1 data2 datan 6.1.2006
data1 data2 datan 7.1.2006
data1 data2 datan 8.1.2006
data1 data2 datan 9.1.2006
data1 data2 datan 10.1.2006

Potřebuji, aby mi vypadlo:

Nějaký_text - hlavička
data1 data2 datan 1.1.2006
data1 data2 datan 2.1.2006
data1 data2 datan 3.1.2006
data1 data2 datan 4.1.2006
data1 data2 datan 5.1.2006
data1 data2 datan 6.1.2006
data1 data2 datan 7.1.2006
data1 data2 datan 8.1.2006
data1 data2 datan 9.1.2006
data1 data2 datan 10.1.2006

Jinak musím otevřít všechny soubory v Calcu, porovnat, kopírovat, vložit atd. atd.atd...

Poradil by mi někdo jak na to, popř. jaký příkaz na to použít?

Nástroje: Začni sledovat (0) ?

Odpovědi

10.5.2006 01:22 tomas
Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

Berte to spíše jako návod, kudy se ubírat, než přesné řešení Vašeho problému:

echo "title1\ttitle2\ttitle3\tdate" >union.csv

sed -e 1d *_soubor.csv |sort |uniq >> union.csv

10.5.2006 19:52 pavel
Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

Díky za odpověď, zkusím si to nastudovat.

12.5.2006 10:08 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

Jestli to dobře chápu, tak je potřeba vzít všechny datové řádky ze všech souborů, setřídit je podle data, vyházet duplicity a pak to všechno vypsat. Zkusil jsem to napsat v Pythonu. Nejvíc komplikací je s tím tříděním, protože je potřeba datum ve formátu

9.1.2006

převést na trojici

(2006, 1, 9)

Pak to teprve lze použít jako klíč pro sort(). Tady je ten program:

#!/usr/bin/env python
import sys, os, fileinput, re

data = {}
regexp = re.compile('^.*\s+(\d+)\.(\d+).(\d{4})\s+$')
for line in fileinput.input():
  if fileinput.isfirstline():
    hlavicka = line
  try:
    dmy = regexp.search(line).groups()
    key = map(int, dmy)
    key.reverse()
    key = tuple(key)
    data[key] = line
  except AttributeError:
    pass

keys = data.keys()
keys.sort()
sys.stdout.write(hlavicka)
for key in keys:
  sys.stdout.write(data[key])

Když se pustí s parametry

Prvni_soubor.csv Druhy_soubor.csv Treti_soubor.csv

tak vypíše tohle:

Nějaký_text - hlavička
data1 data2 datan 1.1.2006
data1 data2 datan 2.1.2006
data1 data2 datan 3.1.2006
data1 data2 datan 4.1.2006
data1 data2 datan 5.1.2006
data1 data2 datan 6.1.2006
data1 data2 datan 7.1.2006
data1 data2 datan 8.1.2006
data1 data2 datan 9.1.2006
data1 data2 datan 10.1.2006

Nevím, která hlavička tam patří, tak jsem ji vzal z posledního souboru.

12.5.2006 12:14 pavel
Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

Ještě bych chtěl upřesnit ty data, přesný formát je:

data1;data2;datan;2006-05-28 18:20:10

12.5.2006 12:41 xxl
Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

Nevím, jestli to správně chápu. Ale co použít něco takového:

tail +2 Prvni_soubor.csv > data
tail +2 Druhy_soubor.csv >> data
tail +2 Treti_soubor.csv >> data

echo "Nějaký_text - hlavička" > Vysledny_soubor.csv
sort -t\; -gk4,4 data >> Vysledny_soubor.csv

12.5.2006 13:18 pavel
Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

Takže já jsem zkusil:

cat *.csv >spojeno.csv

cat spojeno.csv|sort -n -u -t- -k1,1 >trideno_dle_datumu

Funguje to, ale u toho -t mi nefunguje parametr středník, který tam měl být původně.

Děkuji všem a hlavně prvnímu v této diskuzi, co mi odpověděl a navedl správným směrem.

12.5.2006 20:06 tomas
Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

problém je v tom,že středník je ostrý znak shellu pro oddělování příkazů, které jsou na jednom řádku. Řešení je popsáno v příspěveku od neznámého xxl.

Ještě si zkontrolujte, zda vám hlavičky neskončily na konci výsledného souboru (|tail). Řešením by pak bylo použít místo cat *.csv ,něco jako sed -s -e 1d *.csv

13.5.2006 17:58 pavel
Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

Je to tak, ten příspěvek se středníkem jsem přehlédl (t\;).

Hlavičky mi vychází dobře, ale ten příkaz si aspoň zkusím.

15.5.2006 20:18 pavel
Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

Tak mi to jede dobře jen s jedním měsícem, pokud tam přidám soubory s dalším měsícem, třídí to špatně. Tak jsem zase na začátku, pomoc...

15.5.2006 22:17 pavel
Rozbalit Rozbalit vše Re: sloučení několika souborů ve formátu *.csv

Takže takto mi to třídí dobře:

cat *.csv >spojeno.csv

cat spojeno.csv |sort -u -t- -k2 >trideny.csv

Už jsem myslel, že to nepůjde a vzdám to.

Založit nové vlákno • Nahoru

Tiskni Sdílej: