Portál AbcLinuxu, 12. června 2025 14:04


Dotaz: Rozdílné cp1250

30.10.2009 19:14 rostm
Rozdílné cp1250
Přečteno: 362×
Odpovědět | Admin
Pokud uložím na linuxu soubor v cp1250 (uloženo v oo.org nebo konvertováno pomocí iconv) se mi na windows v programech jako photoshop nebo notepad písmena č,ě,ď zobrazují jako úplně jiné znaky. Obráceně ale oo.org nebo jiná aplikace přečtou cp1250 z notepadu v pořádku. Stáhl jsem proto oo.org na windows, ale mezi ním notepadem a photoshopem se projevuje stejná nekompatibilita.

Zkusil jsem podle článku použít příkaz enca abych si ověřil typy kódování, ale vypadně z něj: enca -L czech openoffice-verze.txt MS-Windows code page 1250 LF line terminators enca -L czech notepad-verze.txt MS-Windows code page 1250 Mixed line terminators

tedy kromě znaků pro ukončení řádku by nikde neměl být rozdíl.
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

30.10.2009 19:19 rostm
Rozbalit Rozbalit vše Re: Rozdílné cp1250
Odpovědět | | Sbalit | Link | Blokovat | Admin
pardon špatně jsem zarovnal ten kód: enca -L czech openoffice-verze.txt

MS-Windows code page 1250

LF line terminators

enca -L czech notepad-verze.txt

MS-Windows code page 1250

Mixed line terminators
30.10.2009 20:20 Andrej Herceg | skóre: 43
Rozbalit Rozbalit vše Re: Rozdílné cp1250
Odlíšiť CP1250 a ISO8859-2 je asi dosť zložité, keďže rozdiel je len v pár znakoch (práve v tých, čo píšeš), takže je dosť možné, že to nie je CP1250 ako ti píše enca.
30.10.2009 21:41 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Rozdílné cp1250
Odpovědět | | Sbalit | Link | Blokovat | Admin
Podle popisu by to vypadalo, že OOo to v 1250 neuloží. Zkontrolujte to nějakým editorem, ASCII hodnotu toho znaku, jestli je to opravdu hodnota která odpovídá windows-1250. Enca se může i mýlit, mezi windows-1250 a iso8859-2 je rozdíl jen v pár znacích.
30.10.2009 21:44 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Rozdílné cp1250
Další možnost by byla, že OOo to uloží dobře, ale Notepad se snaží být chytřejší než pánbů a když detekuje LF konce řádků, tak si řekne, že to bude asi Linux kódování (iso8859-2 :) ale to jen hádám podle charakteru OS ;)
31.10.2009 00:51 l4m4
Rozbalit Rozbalit vše Re: Rozdílné cp1250
Znaky ě, č a ď jsou v obou kódováních na stejných posicích, takže pokud se zobrazují špatně, problém není ISO vs. MS-DOS.
31.10.2009 08:22 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Rozdílné cp1250
Jo to je dobrý postřeh :) Problém vlastně notoricky dělají jen ť a ještě jeden znak, který jsem už zapomněl.
bash$ echo -n "ěčďť" | iconv -f utf-8 -t iso8859-2 | od -tx1
0000000 ec e8 ef bb
bash$ echo -n "ěčďť" | iconv -f utf-8 -t cp1250 | od -tx1
0000000 ec e8 ef 9d
31.10.2009 10:47 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: Rozdílné cp1250
š
In Ada the typical infinite loop would normally be terminated by detonation.
30.10.2009 23:27 dizz
Rozbalit Rozbalit vše Re: Rozdílné cp1250
Odpovědět | | Sbalit | Link | Blokovat | Admin
a nebylo bz jednodusi se na cp1250 vykaslat a pouzit iso-8859-2 nebo utf-8?
31.10.2009 10:36 rostm
Rozbalit Rozbalit vše Re: Rozdílné cp1250
Odpovědět | | Sbalit | Link | Blokovat | Admin
Zdá se že to bylo ono :-)

Díky všem. Bohužel se na něj nemůžu vykašlat - i když bych rád...
31.10.2009 10:37 rostm
Rozbalit Rozbalit vše Re: Rozdílné cp1250
Odpovědět | | Sbalit | Link | Blokovat | Admin
Zdá se že to bylo ono :-) tzn. iso vs cp1250

Díky všem. Bohužel se na něj nemůžu vykašlat - i když bych rád...

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.