Portál AbcLinuxu, 1. června 2025 12:23


Dotaz: Proč Unicode (UTF-8) místo ISO-8859-2?

13.12.2003 23:28 Begleiter | skóre: 47 | blog: muj_blog | Doma
Proč Unicode (UTF-8) místo ISO-8859-2?
Přečteno: 2174×
Odpovědět | Admin

Jaké výhody skýtá používání kódování Unicode (UTF-8) oproti ISO-8859-2 pro uživatele, který si sem tam napíše XML (HTML) dokument, ve kterém by de facto vystačil s ASCII nebýt diakritiky?

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

13.12.2003 23:58 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Odpovědět | | Sbalit | Link | Blokovat | Admin
Já tedy nevím, jak píšeš v Latin2 české uvozovky, elipsu, pomlčku, ... entitami? UTF-8 (a UTF-16) jsou pro XML default, nemusejí se ani deklarovat. Jinak je to jedno, protože tvoji otázku lze formulovat ,,k čemu potřebuji UTF-8, když ho k ničemu nepotřebuji`` ;-)
14.12.2003 00:03 Tomáš Hála | skóre: 39 | blog: blog
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Odpovědět | | Sbalit | Link | Blokovat | Admin
Vysvetleni strucne a podrobne.
14.12.2003 00:14 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Nj, to jsou výhody Unicode obecně, tím nepředvědčíš nikoho, kdo chce používat jen češtinu a zbytek je mu jedno...
14.12.2003 00:29 Tomáš Hála | skóre: 39 | blog: blog
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
To neni tak uplne pravda. Unicode je vyhodne i kdyz pisu jen cesky, protoze kdyz ten dokument bude chtit po me precist nekdo z Ameriky, Japonska nebo treba Ulambataru, tak nebude muset resit, v jakem kodovani je napsan, shanet prislusne fonty atd. Pravdepodobnost, ze si Japonec bude chtit neco cist v cestine, sice neni zrovna nejvetsi, ale ted se vstupem do unie to uz zacina byt zajimave vice.
14.12.2003 01:01 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Realita: Borec z Ameriky si dodnes myslí, že 26 písmen ASCII stačí na všechno -- v nejhorším tedy Latin1 (kvůli těm divným evropským jazykům). Japonka používá EUC-JP, UJIS, SJIS, některé z mnoha dalších JIS X a C -- a k tomu možná i Unicode. V Ulambátaru jsou rádi, že mají ASCII.
14.12.2003 10:17 ferda
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Proč zrovna latin2? Kameníci, to je kódování! To si přečtu i na kompu toho Americkýho borce s latin1. :-) Do Ulambátoru se zatim nechystam...
15.12.2003 11:36 Vac
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Je to Ulanbátar (v češtině) ;)
15.12.2003 12:07 Quak
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
A co takhle KOI8cs. to je teprv něco!
14.12.2003 00:21 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Odpovědět | | Sbalit | Link | Blokovat | Admin
Dnes: žádné. Za dva (tři, pět, x) roky, až budeme všichni sjednocení a spokojení ;-) to přinese tu výhodu, že všechny UNIkódované texty nebude nutné převádět, protože už budou v UNIverzálním kódování. Realisticky a bez suchého humoru: pokud máte distru, která ho používá jako systémové kódování (RH family?), jděte s dobou a sneste ty ústrky, které vám připravují různé programy tím, že si s ním neumí poradit. Protože tyto programy zaniknou, nebo ho začnou používat. AFAIK je unicode používáno prostředími GNOME a KDE, takže mainstreamem. Mnoho programů ho také 'umí', ale nenutí uživatele násilím. Domnívám se, že by neměl být problém, v podstatě vám může být jedno, v čem jsou vaše texty kódované, pokud vám nenadávají win-pozitivní kolegové, protože MSUnicode je/bude určitě odlišný v přesně 3% znaků. :-/ Halt je to standard... --vo
Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress
14.12.2003 00:51 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Bohužel jsou stále značné problémy třeba s TeXem (který doufám nezanikne), obskurními MUA (kteří sice zaniknou, ale právě teď je používají lidé, kterým běžně píšete), perlem (který sice Unicode umí, ale v každé subverzi ho řeší jinak), obstarožními distribucemi (nechci jmenovat, abych nepopudil debianisty ;-) sedem, lessem, MySQL, ... Takže pokud jsem klikač, který zná jen KDE, Mozillu a OpenOffice, tak mi asi všechno funguje, a možná ani nevím, jestli to vlastně používá UTF-8, ISO Latin2 nebo Pišvejcovo kódování... Ale zastánci příkazové řádky mají s Unicode život těžší -- a to říkám jako poměrně velký propagátor Unicode <sigh>
14.12.2003 01:03 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Věřím tomu, že TeX nebude mít problém. ;-) Ostatní věci jsou myslím řešitelné celkem v pohodě. A kdyžtak zanikne debian, však co... :-D Pyšvejcovo kódování píše Petr Olšák obvykle s 'y', pokud se nemýlím...:-D (BTW, byls na té přednášce?) Taky by mě zajímalo, jak to dopadne; kdy se dočkám Unicode Slackwaru...:-( --vo
Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress
14.12.2003 01:31 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Ad TeX: nebude, ale jestli mezitím nezanikne, než se to dořeší :-( U Pišvejce se řídím kánonem, tj. TBN, str. 17, kde ho píše s ,i` ;-) Na přednášce jsem bohužel nebyl... Já jsem ohledně Unicode realista -- což znamená, že optimistický názor, že do dvou let se dořeší zbývající problémy, a pak budou prakticky všichni používat Unicode, jsem zastával tak před třemi lety... a nějak to pořád nepřichází...
14.12.2003 10:26 ferda
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Ale zlepšuje se to. Už můžu ve Fedoře číst aspoň český manuálový stránky. Akorát nechápu, proč maji distribuce furt problémy s příkazovym řádkem - de to nastavit, aby to fungovalo, ale to bych očekával od distribucí už funkčí.
14.12.2003 10:43 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Zato nemůžeš pro změnu číst některé manuálové stránky, když používáš Latin2 ;-) Ale jo, zlepšuje se to, byť pomalu...
14.12.2003 12:55 Beda
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
fedora? ROFL. viz lynx na core 1 CDckach. /etc/lynx.* jj pokud se nebugreportuje idealne i s patchem, tak se nedivte, ze se nic nespravi.
Stanislav Brabec avatar 15.12.2003 11:03 Stanislav Brabec | skóre: 45 | Praha
Rozbalit Rozbalit vše TeX a UTF-8
Petr Olšák to již vyřešil novou verzí EncTeXu. Teď jde o to přemluvit ASCII-pozitivní kolegy kolem Web2C, že to není jen samoúčelné rozšíření, ale pro Středoevropany životní nutnost. P. S.: I bez UTF-8 - zkuste si cvičně vysázet francouzsko-český text bez EncTeXu.
14.12.2003 14:04 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
souhlasim unicode prinasi v soucasne dobe jenom komplikace (zkusenost s RH 8) a na normalni praci to neni (je nom treba takovy mc, byl nepouzitelny, a to nebyla jedina aplikace) na druhou stranu, ted chtela kamaradka napsat text, ktery byl v cestine a rustine - docela me prekvapilo, ze pro openoffice.org to je neprekonatelny problem, na druhe strane, KDE se s tim nadherne vyporadalo - to je mozna prakticke pouziti UNICODE, ale na normalni praci, furt musim trvat na tom, ze iso je o neco lepsi.
Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.
14.12.2003 14:31 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Mno, to bych celkem rozlišoval, co je to ta normální práce. Já normálně edituji texty v UTF-8 (gvim -- no problem), v Latin2 už píšu v podstatě jen zdrojáky TeXu a maily. Ale jiná věc je nastavit si komplet UTF-8 locales, protože pak se projeví, kde který zapadlý vlastenec, totiž program, přestane správně fungovat...
xpj avatar 14.12.2003 21:52 xpj | skóre: 22 | blog: Malé linuxové radosti... a strasti | Řevnice
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Používám Fedoru a už od dob RH8 píšu vše v UTF-8. Problémy nemám... Do LaTeXu jsem si dal tohle: \usepackage[utf8]{inputenc} a tak to mydlim i do TeXu. No Problemo... (možná ještě to chce balík ucs...)
14.12.2003 22:25 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Fakt? Jak ti funguje české UTF-8 třídění v MySQL? V kolika skriptech jsi musel měnit wc -c na wc -m? A co skripty v Perlu s use locale pro české třídění a regulárními výrazy s UTF-8 -- přechod 5.6 na 5.8 byl zajímavý, že? O nefunkčním cstocs v 5.8 ani nemluvě. A třeba konstrukce ${variable%...} a ${variable#...} v bashi -- báječně to rozsekává po bajtech namísto znaků, co? IIRC v RH8 nepodporoval UTF-8 ještě ani sed... Pokud jde o TeX, nemá smysl opakovat flamewar okolo encTeXu, ale \usepackage[utf8]{inputenc} ti neumožní nastavit českému písmenu catcode (lccode, sfcode, ...) => tududu tú; na nějaké legrácky je to použitelné, ale solidní řešení je až encTeX.
xpj avatar 15.12.2003 10:59 xpj | skóre: 22 | blog: Malé linuxové radosti... a strasti | Řevnice
Rozbalit Rozbalit vše Proč Unicode (UTF-8) místo ISO-8859-2?
Mám Fedoru a používám ji jako desktop, neběží tam web ani mysql a s problémy v bashi, wc, perlu se nesetkávám, protože v tom neprogramuju. Ad TeX, nenarazil jsem na žádné potíže, co je encTeX nevím (takže nechci žádnou flame rozpoutávat). Píšu teď diplomku v LaTeXu (samozřejmě v UTF) a nepřišel jsem na něco, co by nefungovalo. Toť vše z mé strany...

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.