Portál AbcLinuxu, 12. května 2025 10:27
Mam mensi problem s jednim programkem jmenem "enca". Jde o to, ze mi nejak odmita rozpoznat cokoliv, co je kodovano v CP-1250. Chtel jsem ho pouzit na prekodovani nazvu nekolika souboru, ale uspel jsem jenom castecne (cca 50%).
Jednak nerozpoznal cokoliv v CP1250 (Unknown encoding, pri pokusu o enconv to hodi chybu: Cannot convert 'STDIN' from unknown encoding) a jednak u nekterych veci v ISO 8859-2 se mi snazil vnutit nejake pomerne jine (spatne) kodovani.
Divne na tom je hlavne to, ze treba iconv zminene texty v CP1250 prevede na ISO vcelku bez problemu.
Do zdrojaku enca jsem se nedival, ale docela by me zajimalo, odkud enca bere "vstupni" kodovani.
Dalsi info o systemu:find ... >soubor
, přenést soubor a porovnat.
2. Zdá se, že se snažíš detekovat kódování jmen jednotlivých skladeb. To moc dobře nefunguje, protože jsou velmi krátké a obsahují jen velmi málo písmen s diakritikou, takže statistické metody v enca nedávají spolehlivé výsledky.
3. Řádek ./Robert Křesťan a Druhá Tráva/Disk 2/03 - Vrs<9d> se.mp3
zjevně obsahuje ť ve dvou různých kódováních zároveň, tudíž není v žádném konkrétním kódování.
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.