abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 00:55 | Komunita

Vedení Nadace pro svobodný software (FSF) vydalo oficiální prohlášení k návratu Richarda Stallmana (RMS) do vedení FSF. Richard Stallman promluvil ke komunitě kolem svobodného softwaru.

Ladislav Hagara | Komentářů: 2
včera 20:33 | Pozvánky

Ve středu 14. dubna pořádá brněnský Red Hat tradiční akci Open House, letos opět ve virtuální podobě. Open House nabízí studentům, ale i zájemcům z široké veřejnosti příležitost poznat Red Hat, jeho kulturu a dozvědět se o stážích a pracovních příležitostech. Letošní program nabídne 3 souběžné streamy od více než 30 přednášejících. Jeden z nich bude věnován technickým přednáškám, kde se dozvíte o různých projektech a produktech, na kterých

… více »
Dorka | Komentářů: 0
včera 16:11 | IT novinky

Microsoft kupuje firmu Nuance Communications za 19,7 miliardy dolarů. Nuance Communications se věnuje rozpoznávání řeči pomocí umělé inteligence především ve zdravotnictví. Technologie od Nuance Communications je použita také ve virtuálním asistentovi Siri.

Ladislav Hagara | Komentářů: 10
včera 14:44 | Nová verze

Český překladatelský tým LibreOffice vydává příručku LibreOffice Writer verze 6.4. Kniha představuje některé hlavní funkce aplikace LibreOffice Writer:… více »

Zdeněk Crhonek | Komentářů: 0
včera 13:33 | Nová verze

Příspěvek na blogu webové aplikace pro spolupráci na zdrojových kódech pomocí gitu Gitea (Wikipedie) představuje novinky nové verze 1.14.0 této v programovacím jazyce Go naprogramované aplikace.

Ladislav Hagara | Komentářů: 0
včera 09:00 | Nová verze

V březnu 2016 byl 2D animační software Toonz uvolněn jako open source pod názvem OpenToonz. O víkendu byl OpenToonz vydán ve verzi 1.5.0. Přehled novinek v poznámkách k vydání na GitHubu. Novou verzi bude možné nainstalovat také z Flathubu a Snapcraftu.

Ladislav Hagara | Komentářů: 0
včera 08:00 | IT novinky

Společnost Espressif Systems oznámila, že rodinu SoC ESP32 brzy rozšíří o ESP32-C6 s 32bitovým RISC-V jádrem a podporou Wi-Fi 6 a Bluetooth 5 (LE).

Ladislav Hagara | Komentářů: 0
9.4. 18:33 | Zajímavý článek

MojeFedora.cz informuje co nového přinese Fedora Workstation 34. Většinu uživatelů praští do očí přepracované GNOME 40, ale další důležité změny se dějí i pod povrchem. Wayland na grafických kartách Nvidia, Pipewire jako hlavní zvukový subsystém, Fedora Toolbox s RHEL, Flatpaky ve Fedoře s inkrementálními aktualizacemi.

Ladislav Hagara | Komentářů: 49
9.4. 15:11 | Nová verze

Byla vydána verze 4.4 kolekce svobodného softwaru umožňujícího nahrávání, konverzi a streamovaní digitálního zvuku a obrazu FFmpeg (Wikipedie). Kódové označení Rao bylo vybráno na počest profesora K. R. Raa za práci na DCT (diskrétní kosinová transformace).

Ladislav Hagara | Komentářů: 7
9.4. 13:55 | Nová verze

Český LibreOffice tým aktualizoval příručku LibreOffice Calc na verzi 7.0. Kniha je určena pro uživatele tabulkového procesoru LibreOffice Calc. Pokrývá hlavní oblasti programu Calc, včetně zadávání, úprav a formátování dat, funkcí a vzorců pro výpočty nad daty, statistické analýzy, kontingenčních tabulek a hledání řešení pro potřeby analýz, databázových funkcí pro nastavení, ukládání a filtrování dat, široké škály 2D a 3D grafů,

… více »
Zdeněk Crhonek | Komentářů: 0
Kolik času v průměru denně trávíte videohovory/-konferencemi? (ať už v práci, škole nebo soukromě)
 (51%)
 (13%)
 (16%)
 (10%)
 (8%)
 (1%)
 (1%)
Celkem 272 hlasů
 Komentářů: 7, poslední 8.4. 12:14
Rozcestník

Dotaz: Špatně interpretované multibyte znaky

5.3.2005 18:07 Jan Odvárko | skóre: 10
Špatně interpretované multibyte znaky
Přečteno: 251×
Na něco podobného už jsem se tu ptal, ale ukázalo se, že řešení fungovalo jen s locales ISO8859-2, unicode zase zlobí.

Nedávno jsem zjistil, že chyba je někde až nad shellem, protože se to chová divně ve všech shellech. Pokud v jakémkoli shellu napíšu např.:
echo "Něco s háčky a čárkami" >/tmp/out
pak se do souboru /tmp/out onen text skutečně zapíše v UTF-8, ale špatně, protože, jak poznamenal Yeti, se text interpretuje jako by byl v Latin1.

Když v Bashi např. napíšu pár diakritických znaků v příkazové řádce a potom je umažu, pak se mi umaže i část promptu, čili Bash interpretuje každý znak jako byte. Shell sh pracuje se znaky korektně, ale když je zapíšu tak je výsledek stejně špatný.

Moje locales teď jsou:
export LANG=cs_CZ.utf8
export LC_ALL=cs_CZ.utf8
a ve svém .profile volám
unicode_start /usr/share/kbd/consolefonts/lat2-14.psfu.gz
Alespoň potřebuju vědět, kde hledat chybu. Nainstaloval jsem si nejnovější Bash, Readline a SLang, ale nic se nezlepšilo. Shellem to nebude. Já nevím, je snad chyba už při vstupu z klávesnice? Nebo snad volám špatně unicode_start? Nejhorší na tom je, že neexistuje žádná alternativa jako ISO8859-2, dávno jsem odkázaný na unicode.

Díky

Odpovědi

5.3.2005 20:36 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky
1.) Zrušit export LC_ALL=cs_CZ.utf8 tímto akorát některé programy zmatete nechat pouze LANG.

2.) Při nahrávání klávesové mapy jste zadal že používáte unicode ? Klávesové mapy nejsou ještě unicode. ( parametr -u při nahrávání kávesové mapy)
5.3.2005 21:02 Jan Odvárko | skóre: 10
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky
Vyzkoušel jsem obojí, ale pořád se to chová stejně :-(
5.3.2005 21:46 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky
No tak nám podrobně popište co přesně děláte křištálové koule fakt nemáme.

Musí být nastaven správně LANG, systém musí mět podporu cs, klávesová mapa se musí použít s příznakem -u, musí se použít unicode font, terminál se musí přepnout do unicode, klávesnice se musí přepnout do unicode. (kbd_mode -u)

Většinu toho by měl udělat /bin/unicode_start který v FC je:
#!/bin/bash
# Enables Unicode processing in the current console.
#
# 1. The input side: the keyboard driver.

# Set the keyboard driver in Unicode mode. (Default is ASCII mode.)
# This really does nothing with the way normal keys are handled in
# the kernel. All it does is:
# - It is necessary for `dumpkeys' in order to not drop U+XXXX
#   entries from the keymaps.
# - It is necessary for `loadkeys' in order to avoid warnings.
# - Unicode characters typed as Alt-x1 ... Alt-xn (where x1,...,xn
#   are digits on the numeric keypad) will be emitted in UTF-8.

kbd_mode -u

# Change the keyboard mapping in such a way that the non-ASCII keys
# produce UTF-8 encoded multibyte sequences, instead of single bytes
# >= 0x80 in a legacy 8-bit encoding.

dumpkeys | loadkeys --unicode

# 2. The output side: the console screen.

# Tell the console output driver that the bytes arriving are UTF-8
# encoded multibyte sequences.

if test -t 1 -a -t 2 ; then
        echo -n -e '\033%G'
fi

# Tell the graphics card how to display Unicode characters not
# contained in the IBM 437 character set (on PCs). The font should
# have a Unicode map attached, or explicitly specified, e.g.,
# by giving `def.uni' as a second argument.

DEFAULT_UNICODE_FONT=latarcyrheb-sun16
# Also drdos8x16 is a good candidate.

case $# in
        2)
                setfont $1 -u $2
                ;;
        1)
                setfont $1
                ;;
        0)
                setfont $DEFAULT_UNICODE_FONT
                ;;
        *)
                echo "usage: unicode_start [font [unicode map]]"
                ;;
esac
PS. Jinak vím že nějakej bash taky blbnul s unicode (z RH9 ? Už nevím) musel se použít upravenej. (mazal znaky špatně)
5.3.2005 22:03 Jan Odvárko | skóre: 10
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky
No tak nám podrobně popište co přesně děláte křištálové koule fakt nemáme.

Já to popsal jak jsem mohl, víc informací sám nemám, kdybych měl, nemusel bych se ptát.

Zkoušel jsem všechno možné s unicode_start, loadkeys a kbd_mode, ale marně. To že Bash maže znaky špatně není to nejhorší, ale veškerý vstup z klávesnice je právě podle všeho převeden do Latin1. Ale díky za nápad, rozeberu ten skript unicode_start.

5.3.2005 22:37 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky
Doufám že se zde nehovoří o konzolích terminálu v X, ale normální textové konzoli v linuxu (alt-F1, F2 atd...).

Přesný postup jsem myslel zavedu font ..... spustim klavesnici...zavedu mapu .....atd.
5.3.2005 22:44 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky
a ve svém .profile volám

unicode_start /usr/share/kbd/consolefonts/lat2-14.psfu.gz
To je blbě měl by jste volat přepnutí do unicode hned po startu pro všechny terminály, čili někde v rc.local nebo podobně ještě před loginem.
5.3.2005 22:46 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky
A ještě nejsem přesvědčen že ten font co používáte je unicode skuste "latarcyrheb-sun16".

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.