Portál AbcLinuxu, 14. května 2025 02:45
file --mime-encoding zdroj_data.txt;
iconv -futf8 -tiso-8859-2 -onew.txt zdroj_data.txt;
file --mime-encoding new.txt
Výstupem je:
zdroj_data.txt: utf-8
new.txt: iso-8859-1
Byl bych vděčný, kdyby mi někdo dokázal poradit. Ještě přikládám výstup locale:
LANG=cs_CZ.ISO-8859-2
LC_CTYPE="cs_CZ.ISO-8859-2"
LC_NUMERIC="cs_CZ.ISO-8859-2"
LC_TIME="cs_CZ.ISO-8859-2"
LC_COLLATE="cs_CZ.ISO-8859-2"
LC_MONETARY="cs_CZ.ISO-8859-2"
LC_MESSAGES="cs_CZ.ISO-8859-2"
LC_PAPER="cs_CZ.ISO-8859-2"
LC_NAME="cs_CZ.ISO-8859-2"
LC_ADDRESS="cs_CZ.ISO-8859-2"
LC_TELEPHONE="cs_CZ.ISO-8859-2"
LC_MEASUREMENT="cs_CZ.ISO-8859-2"
LC_IDENTIFICATION="cs_CZ.ISO-8859-2"
LC_ALL=
file
kecá. Nemá způsob, jak by to kódování spolehlivě detekoval.
new.txt
nechám vypsat, vidím místo diakritiky nějaké smetí.
cat
iconv -cs -f utf-8 -t latin2 input > output
...?
na zistenie kodovania pouzivam enca
http-equiv
v něm tu informaci bude prohlížeči poskytovat. Jenom tam pořád bude to původní kódování, ne to, do kterého to konvertoval…
iconv -f UTF-8 -t ISO-8859-2 from.txt > ./to.txtVstupní text je uložený jako UTF-8 a výstupní text po otevření v editoru a nastavení na ISO-8859-2 ukazuje původní text.
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.