Portál AbcLinuxu, 6. května 2025 07:35

Dotaz: diff dvoch csv -> výsledok -> 1 súbor s pridanými riadkami a 2 súbor s vymazanými riadkami

8.5.2012 20:26 Peter
diff dvoch csv -> výsledok -> 1 súbor s pridanými riadkami a 2 súbor s vymazanými riadkami
Přečteno: 180×
Odpovědět | Admin
Pozdravujem osadenstvo.

Mám dva CSV súbory (obidva majú okolo 5.000.000 riadkov, čiže potrebujem aj niečo efektívne) a potrebujem z nich urobiť diff tak aby som do jedného súboru dostal pridané riadky medzi novým a starým CSV a v druhom aby som mal odobrané riadky medzi novým a starým CSV. Vtip je ale aj v tom, že riadky môžu byť v novom a v starom CSV náhodne poprehádzané. Príklad:
stary.csv:
a,1
b,2
c,3
d,4
e,5
f,6
novy.csv:
c,3
e,5
a,1
g,7
f,6
d,4
Výsledok -> pridane.csv:
g,7
Výsledok -> odobrane.csv:
b,2
Vopred veľmi pekne ďakujem za pomoc.

Řešení dotazu:


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

8.5.2012 20:34 Kit
Rozbalit Rozbalit vše Re: diff dvoch csv -> výsledok -> 1 súbor s pridanými riadkami a 2 súbor s vymazanými riadkami
Odpovědět | | Sbalit | Link | Blokovat | Admin
Oba prohnat sortem, pak na ně pustit diff a ten pomocí awk rozhodit do těch dvou souborů.
8.5.2012 21:11 rastos | skóre: 63 | blog: rastos
Rozbalit Rozbalit vše Re: diff dvoch csv -> výsledok -> 1 súbor s pridanými riadkami a 2 súbor s vymazanými riadkami
Odpovědět | | Sbalit | Link | Blokovat | Admin
  1. Zosortovať
  2. comm -2 -3 stary.csv novy.csv > subor1.csv
  3. comm -1 -3 stary.csv novy.csv > subor2.csv

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.