Portál AbcLinuxu, 31. července 2025 15:33
perl -Mlocale -pe 's/(\d+[,]\d+)/sprintf "%.0f", $1/ge' puvodni_soubor.txt > vysledny_soubor.txt
Funguje bohužel jenom ten Perl, ale ani to není ideální. Zaokrouhlená čísla jsou kratší. Zmizí čárka a desetinné místo. Proto je třeba přidat před každé zaokrouhlené číslo dvě mezery, jenže já ten Perl neumím změnit.Pokud skutečně stačí přidat jen dvě mezery, tak se jednoduše přidají do formátovacího řetězce v
sprintf
: " %.0f"
.
Perl-u není třeba se bát.
Dá se to vyřešit i obecněji, bez spoléhání na konkrétní počet desetinných míst. Ne nutně v Perlu a ne nutně one-linerem.
perl -pe 's/(\d+)[,](\d+)/sprintf " " x length($2) . " %.0f", "$1.$2"/ge' puvodni_sobor.txtOtázka je jestli zrovna tohle zobecnění bude užitečné. Takových zobecnění se dá vymyslet spousta. Mě například napadlo, že pokud tisíce jsou odělěny mezerou, tak jednak ty mezery nadělají neplechu uprostřed čísla a jednak číslo jako
1 999,50
nedopadne při zaokrouhlování podle předpokladů. :)
Ale nač řešit problém tam, kde nemusí být. Nepřepokládám, že se snaží napsat nějaký univerzální nástroj, ale řeší jednorázovou záležitost.
round
použít int "$1.$2"+.5
. Ale díky tomu, že tam potom chtěl vložit mezery, tak se ukázalo použití sprintf
jako prozřetelný krok :)
-i
:), funguje i -i.bak
podobně jako v Sedu.
perl -i.bak -pe '...' soubor.txt
awk '{for (i = 1; i <= NF; ++i) {z = $i; gsub(/,/, ".", z); if (z + " " == z) $i = int(.5 + z)} print $0}' < vstup > výstup
Aha. Teprve teď jsem si všiml tohoto podivného upřesnění. To taky není problém. Stačí se v awk podívat, jak dlouhé je číslo před zaokrouhlením a po něm, a doplnit mezery. Laxní definice číselných literálů, kterou awk používá, shodou okolností přesně pasuje na tento typ problému. Proto se něco takového tak často vidí ve školních úlohách všeho druhu, že ano.
awk '{for (i = 1; i <= NF; ++i) {a = b = $i; gsub(/,/, ".", b); if (b + " " == b) {b = int(.5 + b); d = length(a) - length(b); $i = ""; for (j = 0; j < d; ++j) $i = $i " "; $i = $i b}} print $0}' < vstup > výstup
Protože mít tohle^^^ jako one-liner je už daleko za vepřovou hranicí, lépe to bude vypadat zformátované:
awk '{ for (i = 1; i <= NF; ++i) { a = b = $i gsub(/,/, ".", b) if (b + " " == b) { b = int(.5 + b) d = length(a) - length(b) $i = "" for (j = 0; j < d; ++j) $i = $i " " $i = $i b } } print $0 }' < vstup > výstup
Nebo jako samostatný spustitelný soubor se skriptem (nazvěme ho můj_hustý_skript.awk
) takto:
#!/usr/bin/awk -f { for (i = 1; i <= NF; ++i) { a = b = $i gsub(/,/, ".", b) if (b + " " == b) { b = int(.5 + b) d = length(a) - length(b) $i = "" for (j = 0; j < d; ++j) $i = $i " " $i = $i b } } print $0 }
Pak se to dá (po chmod +x můj_hustý_skript.awk
) normálně spustit:
./můj_hustý_skript.awk < vstup > výstup
Tohle tedy pochopitelně bude zaokrouhlovat i řetězce obsahující desetinné tečky, které (v českém prostředí) třeba nemají představovat čísla. Je-li něco takového nežádoucí, dá se to ošetřit jednoduchou drobnou úpravou, kterou už bych „ponechal čtenáři za cvičení“, jak s oblibou psal (ne)jeden slavný profesor. Škoda, že nejsem slavný profesor.
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.