Portál AbcLinuxu, 14. května 2025 02:45
cut
, tr
a grep
, nástřel je níže.
Prvý krok - nechaj v každom riadku v sĺpci 6 len číslice a znaky: "čiarka (,) bodkočiarka (;) lomítko (/)"
cut '-d,' -f 6 <vstup.csv | tr -d '0123456789,;/
Druhý krok - vymaž všetky riadky kde sa v sĺpci 6 nenachádza minimálne 6 znakov
grep '^.......*'
PS: neviete mi odporučiť niekto nejakú parádnu knihu na takéto srandy (regex, sed, awk, bash, ......) najlepšie v našom jazyku (slovenčina, čeština) aby som už nemusel tu s takými prkotinami otravovať?
Můžu doporučit Linux: Příručka českého uživatele od Viléma Vychodila.
cat file.csv | awk -F "\t" '{gsub (/[^[:digit:],;\/]/,"",$6)};$6~/....../{print $0}'
s poznámkou: uvádíte, že ..čárka a dvojčárka.. by měli zůstat v sloupci 6. Předpokládám tedy, že tyto znaky NEslouží jako oddělovače sloupců . Ve výše uvedeném příkladu uvažuji jako oddělovač tabelátor (parametr -F "\t"). Jinak podle standardu by "správně" měly být v CSV souboru sloupce oddělené čárku ("Comma Separated Values")
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.