Přihlášení | Registrace

napište » Zprávičky

dnes 05:55 | Nová verze

Po více než 7 měsících vývoje od vydání verze 6.8 byla vydána nová verze 6.9 svobodného open source redakčního systému WordPress. Kódové jméno Gene bylo vybráno na počest amerického jazzového klavíristy Gene Harrise (Ray Brown Trio - Summertime).

Ladislav Hagara | Komentářů: 2

Vývoj webového prohlížeče Ladybird (11/2025)

dnes 05:11 | Komunita

Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za listopad (YouTube).

Ladislav Hagara | Komentářů: 0

Google Chrome 143

dnes 01:55 | Nová verze

Google Chrome 143 byl prohlášen za stabilní. Nejnovější stabilní verze 143.0.7499.40 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 13 bezpečnostních chyb.

Ladislav Hagara | Komentářů: 0

Hardwarový a softwarový průzkum Steamu - 11/2025

včera 19:33 | Nová verze

Společnost Valve aktualizovala přehled o hardwarovém a softwarovém vybavení uživatelů služby Steam. Podíl uživatelů Linuxu dosáhl 3,2 %. Nejčastěji používané linuxové distribuce jsou Arch Linux, Linux Mint a Ubuntu. Při výběru jenom Linuxu vede SteamOS Holo s 26,42 %. Procesor AMD používá 66,72 % hráčů na Linuxu.

Ladislav Hagara | Komentářů: 0

Ubuntu Pro pro WSL

včera 15:22 | IT novinky

Canonical oznámil (YouTube), že nově nabízí svou podporu Ubuntu Pro také pro instance Ubuntu na WSL (Windows Subsystem for Linux).

Ladislav Hagara | Komentářů: 0

Samsung Galaxy Z TriFold

včera 13:11 | IT novinky

Samsung představil svůj nejnovější chytrý telefon Galaxy Z TriFold (YouTube). Skládačka se nerozkládá jednou, ale hned dvakrát, a nabízí displej s úhlopříčkou 10 palců. V České republice nebude tento model dostupný.

Ladislav Hagara | Komentářů: 2

Armbian 25.11.1

včera 12:33 | Nová verze

Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu optimalizovaná pro jednodeskové počítače na platformě ARM a RISC-V, ke stažení ale také pro Intel a AMD, byl vydán ve verzi 25.11.1. Přehled novinek v Changelogu.

Ladislav Hagara | Komentářů: 1

FreeBSD 15.0

včera 04:00 | Nová verze

Byla vydána nová verze 15.0 svobodného unixového operačního systému FreeBSD. Podrobný přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 6

Ubuntu Touch 24.04 1.1 a 20.04 OTA-11

včera 03:00 | Nová verze

UBports, nadace a komunita kolem Ubuntu pro telefony a tablety Ubuntu Touch, vydala Ubuntu Touch 24.04 1.1 a 20.04 OTA-11. Vedle oprav chyb a drobných vylepšení je řešen také středně závažný bezpečnostní problém.

Ladislav Hagara | Komentářů: 0

Ajťácké adventní kalendáře 2025

včera 00:33 | IT novinky

I letos vyšla řada ajťáckých adventních kalendářů: Advent of Code 2025, Perl Advent Calendar 2025, CSS Advent Calendar 2025, Advent of A11Y 2025, Advent of AI Security 2025, Advent of Agents (in Google) 2025, Advent of Svelte 2025, …

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Jaké řešení používáte k vývoji / práci?

Github (34%)

Gitlab (47%)

Atlassian (19%)

Bitbucket (18%)

Gitea (23%)

Mercurial (15%)

jen git (25%)

jen svn (16%)

Jiné (uvedu v diskusi) (18%)

Celkem 426 hlasů

Komentářů: 18, poslední včera 18:34

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / Špatně interpretované multibyte znaky

Štítky: Bash, KDE, kernel, klávesnice, shelly, textové editory, Vim

Dotaz: Špatně interpretované multibyte znaky

5.3.2005 18:07 Jan Odvárko | skóre: 10
Špatně interpretované multibyte znaky

Přečteno: 320×

Odpovědět | Admin

Na něco podobného už jsem se tu ptal, ale ukázalo se, že řešení fungovalo jen s locales ISO8859-2, unicode zase zlobí.

Nedávno jsem zjistil, že chyba je někde až nad shellem, protože se to chová divně ve všech shellech. Pokud v jakémkoli shellu napíšu např.:

echo "Něco s háčky a čárkami" >/tmp/out

pak se do souboru /tmp/out onen text skutečně zapíše v UTF-8, ale špatně, protože, jak poznamenal Yeti, se text interpretuje jako by byl v Latin1.

Když v Bashi např. napíšu pár diakritických znaků v příkazové řádce a potom je umažu, pak se mi umaže i část promptu, čili Bash interpretuje každý znak jako byte. Shell sh pracuje se znaky korektně, ale když je zapíšu tak je výsledek stejně špatný.

Moje locales teď jsou:

export LANG=cs_CZ.utf8
export LC_ALL=cs_CZ.utf8

a ve svém .profile volám

unicode_start /usr/share/kbd/consolefonts/lat2-14.psfu.gz

Alespoň potřebuju vědět, kde hledat chybu. Nainstaloval jsem si nejnovější Bash, Readline a SLang, ale nic se nezlepšilo. Shellem to nebude. Já nevím, je snad chyba už při vstupu z klávesnice? Nebo snad volám špatně unicode_start? Nejhorší na tom je, že neexistuje žádná alternativa jako ISO8859-2, dávno jsem odkázaný na unicode.

Díky

Nástroje: Začni sledovat (0) ?

Odpovědi

5.3.2005 20:36 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky

1.) Zrušit export LC_ALL=cs_CZ.utf8 tímto akorát některé programy zmatete nechat pouze LANG.

2.) Při nahrávání klávesové mapy jste zadal že používáte unicode ? Klávesové mapy nejsou ještě unicode. ( parametr -u při nahrávání kávesové mapy)

5.3.2005 21:02 Jan Odvárko | skóre: 10
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky

Vyzkoušel jsem obojí, ale pořád se to chová stejně :-(

5.3.2005 21:46 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky

No tak nám podrobně popište co přesně děláte křištálové koule fakt nemáme.

Musí být nastaven správně LANG, systém musí mět podporu cs, klávesová mapa se musí použít s příznakem -u, musí se použít unicode font, terminál se musí přepnout do unicode, klávesnice se musí přepnout do unicode. (kbd_mode -u)

Většinu toho by měl udělat /bin/unicode_start který v FC je:

#!/bin/bash
# Enables Unicode processing in the current console.
#
# 1. The input side: the keyboard driver.

# Set the keyboard driver in Unicode mode. (Default is ASCII mode.)
# This really does nothing with the way normal keys are handled in
# the kernel. All it does is:
# - It is necessary for `dumpkeys' in order to not drop U+XXXX
#   entries from the keymaps.
# - It is necessary for `loadkeys' in order to avoid warnings.
# - Unicode characters typed as Alt-x1 ... Alt-xn (where x1,...,xn
#   are digits on the numeric keypad) will be emitted in UTF-8.

kbd_mode -u

# Change the keyboard mapping in such a way that the non-ASCII keys
# produce UTF-8 encoded multibyte sequences, instead of single bytes
# >= 0x80 in a legacy 8-bit encoding.

dumpkeys | loadkeys --unicode

# 2. The output side: the console screen.

# Tell the console output driver that the bytes arriving are UTF-8
# encoded multibyte sequences.

if test -t 1 -a -t 2 ; then
        echo -n -e '\033%G'
fi

# Tell the graphics card how to display Unicode characters not
# contained in the IBM 437 character set (on PCs). The font should
# have a Unicode map attached, or explicitly specified, e.g.,
# by giving `def.uni' as a second argument.

DEFAULT_UNICODE_FONT=latarcyrheb-sun16
# Also drdos8x16 is a good candidate.

case $# in
        2)
                setfont $1 -u $2
                ;;
        1)
                setfont $1
                ;;
        0)
                setfont $DEFAULT_UNICODE_FONT
                ;;
        *)
                echo "usage: unicode_start [font [unicode map]]"
                ;;
esac

PS. Jinak vím že nějakej bash taky blbnul s unicode (z RH9 ? Už nevím) musel se použít upravenej. (mazal znaky špatně)

5.3.2005 22:03 Jan Odvárko | skóre: 10
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky

No tak nám podrobně popište co přesně děláte křištálové koule fakt nemáme.

Já to popsal jak jsem mohl, víc informací sám nemám, kdybych měl, nemusel bych se ptát.

Zkoušel jsem všechno možné s unicode_start, loadkeys a kbd_mode, ale marně. To že Bash maže znaky špatně není to nejhorší, ale veškerý vstup z klávesnice je právě podle všeho převeden do Latin1. Ale díky za nápad, rozeberu ten skript unicode_start.

5.3.2005 22:37 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky

Doufám že se zde nehovoří o konzolích terminálu v X, ale normální textové konzoli v linuxu (alt-F1, F2 atd...).

Přesný postup jsem myslel zavedu font ..... spustim klavesnici...zavedu mapu .....atd.

5.3.2005 22:44 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky

a ve svém .profile volám
unicode_start /usr/share/kbd/consolefonts/lat2-14.psfu.gz

To je blbě měl by jste volat přepnutí do unicode hned po startu pro všechny terminály, čili někde v rc.local nebo podobně ještě před loginem.

5.3.2005 22:46 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Špatně interpretované multibyte znaky

A ještě nejsem přesvědčen že ten font co používáte je unicode skuste "latarcyrheb-sun16".

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje