Portál AbcLinuxu, 26. dubna 2024 20:31

Lokalizace aplikací, Gettext

17.3.2009 23:00 | Přečteno: 3501× | Programování | Výběrový blog

Kostlivec z roku 2004, začátek nedopsaného seriálu, třeba se to bude někomu do začátků hodit... Jak lokalizovat (překládat) aplikace. Jak psát lokalizovatelné aplikace. Použití standardních nástrojů. Příklady pro Python, C, Glade, Bash.

Podíváme se, pro jaké jazyky máme vygenerované locales.

$ locale -a
C
cs_CZ
cs_CZ.iso88592
czech
POSIX

Budeme-li chtít vygenerovat další locales, upravíme /etc/locale.gen.

en_US ISO-8859-1
cs_CZ ISO-8859-2
sk_SK ISO-8859-2

a spustíme skript locale-gen.

# locale-gen
Generating locales...
en_US.ISO-8859-1... done
cs_CZ.ISO-8859-2... done
sk_SK.ISO-8859-2... done
Generation complete.

Tento skript smaže staré locale data v /usr/lib/locale a vygeneruje nové dle výše zmiňovaného konfiguračního souboru. Např. pro náš jazyk spustí.

localedef -i cs_CZ -c -f ISO-8859-2 -A /etc/locale.alias cs_CZ

Program by měl nejprve číst proměnnou $LC_ALL. Když nic neobsahuje, přečte nastavení z proměnných (umožňují různorodé nastavení jednotlivých kategorií) uvedených v následujícím výpisu. Teprve poté použije případně proměnnou $LANG.

$ locale
LANG=cs_CZ
LC_CTYPE="cs_CZ"
LC_NUMERIC="cs_CZ"
LC_TIME="cs_CZ"
LC_COLLATE="cs_CZ"
LC_MONETARY="cs_CZ"
LC_MESSAGES="cs_CZ"
LC_PAPER="cs_CZ"
LC_NAME="cs_CZ"
LC_ADDRESS="cs_CZ"
LC_TELEPHONE="cs_CZ"
LC_MEASUREMENT="cs_CZ"
LC_IDENTIFICATION="cs_CZ"
LC_ALL=
$ date
So kvě 1 16:34:49 CEST 2004
$ LC_ALL=C date
Sat May 1 16:34:57 CEST 2004

V případě, že nejsou nalezeny příslušné soubory (nebo je hodnota proměnné C), použijí se řetězce zakompilované v programu. Proměnné předáváme hodnotu v následujícím formátu (případně můžeme použít přezdívku definovanou v /etc/locale.alias).

jazyk[_země][.znaková sada] (např. cs_CZ.ISO-8859-2)

Překlad textových řetězců pro MC nalezname v binárním souboru /usr/share/locale/cs/LC_MESSAGES/mc.mo. V původní textové podobě ho můžeme získat následujícím příkazem.

$ msgunfmt /usr/share/locale/cs/LC_MESSAGES/mc.mo > mc.po

Podívejte se na obsah získaného souboru.

Python, Glade

Máme následující skript v Pythonu l10n1-python.py a XML soubor z Glade l10n1-python.glade.

#!/usr/bin/python -d
# -*- coding: utf-8 -*-

import gtk
import gtk.glade
import gettext

gettext.bindtextdomain('l10n1-python', '/usr/share/locale')
gettext.textdomain('l10n1-python')
gtk.glade.bindtextdomain('l10n1-python', '/usr/share/locale')
gtk.glade.textdomain('l10n1-python')
_ = gettext.gettext

xml = gtk.glade.XML('l10n1-python.glade', 'window')

def spustit(button):
  info_LB.set_text(_("Complete."))

def quit(window):
  gtk.main_quit()
  print _("End...")

xml.signal_autoconnect(locals())
info_LB = xml.get_widget("info_LB")
gtk.main()

Na začátku definujeme, kde se má hledat MO soubor a veškerý text, který budeme chtít přeložit, umístíme do _(""). Nyní vytvoříme katalog, otevřeme si ho v našem oblíbeném editoru, provedeme překlad a nezapomeneme definovat kódování atp. na začátku katalogu. Poté soubor s překladem převedeme do binárního tvaru a zkopírujeme do /usr/share/locale/.

$ xgettext l10n1-python.py l10n1-python.glade -o l10n1-python.po
$ vim l10n1-python.po
$ msgfmt l10n1-python.po -o l10n1-python.mo
# cp ./l10n1-python.mo /usr/share/locale/cs/LC_MESSAGES/l10n1-python.mo

Vyzkoušíme, jestli vše funguje.

$ LC_ALL=C ./l10n1-python.py
End...
$ LC_ALL=cs_CZ ./l10n1-python.py
Konec...

C

l10n1-program.c

#include <locale.h>
#include <libintl.h>

#define PACKAGE   "l10n1-program"
#define LOCALEDIR "/usr/share/locale"
#define _(str) gettext(str)

int main(void) {
  setlocale(LC_ALL,"");
  bindtextdomain(PACKAGE, LOCALEDIR);
  textdomain(PACKAGE);

  printf(_("Hello World.\n"));
  printf(_("Dir: %s\n"), LOCALEDIR);
  exit(0);
}

U céčkových programů hledá implicitně xgettext ve zdrojovém kódu klíčové slovo gettext, ale my používáme kratší _.

$ xgettext --keyword=_ l10n1-program.c -o l10n1-program.po

Bash

l10n1-bash.sh

#!/bin/bash

TEXTDOMAINDIR=/usr/share/locale
TEXTDOMAIN=l10n1-bash

echo $"Hello World."
printf $"Dir: %s\n" $TEXTDOMAINDIR

První příkaz získá ze skriptu řetězce pro překlad a druhý přidá hlavičku katalogu.

$ bash --dump-po-strings l10n1-bash.sh > l10n1-bash.po
$ xgettext l10n1-bash.po -o l10n1-bash.po

Další nasměrování => po-mód v Emacsu, plugin po.vim ve Vimu a program KBabel. ;-)

       

Hodnocení: 100 %

        špatnédobré        

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře. , Tisk

Vložit další komentář

Jardík avatar 17.3.2009 23:32 Jardík | skóre: 40 | blog: jarda_bloguje
Rozbalit Rozbalit vše Re: Lokalizace aplikací, Gettext
Odpovědět | Sbalit | Link | Blokovat | Admin
Já bych měl dotaz na ten gettext, ještě mi nedchází jedna věc. Když zavolám příslušnou gettextovou funkci, vrátí se mi řetězec a v žádné aplikaci, kterou jsem studoval, se takto vrácený řetězec nikde neuvolňuje z paměti a je tam do umření programu (?). Když ho zavolám podruhé, alokuje se znovu, nebo se použije ten naalokovaný už předtím (= asi nee thread safe jestli to nepoužívá mutexy).
Věřím v jednoho Boha.
Fuky avatar 18.3.2009 01:15 Fuky | skóre: 52 | blog: 4u
Rozbalit Rozbalit vše Re: Lokalizace aplikací, Gettext

Glibc6 používá thread safe funkce, gettext je součást této knihovny, takže by na tom měl být v současné době stejně, s vyjímkou volání fce setlocale(), která z důvodů náročnosti není thread safe:

3.19. bonnie reports that char i/o with glibc 2 is much slower than with libc5. What can be done?
4.2 Triggering gettext Operations

Díky makru HAVE_PER_THREAD_LOCALE lze od roku 2005 používat v různých vláknech různé nastavení locales:

fix for multithreaded gettext() tests

Funkce gettext() vrací ukazatel na string, který je staticky alokovaný a nesmí se tedy měnit ani uvolňovat (man 3 gettext):

If a translation was found in one of the specified catalogs, it is converted to the locale’s codeset and returned. The resulting string is statically allocated and must not be modified or freed. Otherwise msgid is returned.

Pro podrobnosti mrkni do zdrojáků glibc...

Jardík avatar 18.3.2009 11:16 Jardík | skóre: 40 | blog: jarda_bloguje
Rozbalit Rozbalit vše Re: Lokalizace aplikací, Gettext
Ok, ale jak může být staticky alokován, když se alokuje "za běhu" aplikace? Nebo je tam předdefinovaný buffer, který se pořád přepisuje (= omezení délky řetězce)?
Věřím v jednoho Boha.
Fuky avatar 18.3.2009 15:33 Fuky | skóre: 52 | blog: 4u
Rozbalit Rozbalit vše Re: Lokalizace aplikací, Gettext
Využívá se fce mmap() a soubor *.mo se namapuje do paměti, viz glibc-2.7/locale/loadlocale.c a fce _nl_load_locale().
Jardík avatar 18.3.2009 17:16 Jardík | skóre: 40 | blog: jarda_bloguje
Rozbalit Rozbalit vše Re: Lokalizace aplikací, Gettext
Ok, díky moc. Mně se nechtěli studovat zdrojáky, alespoň jsem teď o něco chytřejší :-)
Věřím v jednoho Boha.
Fluttershy, yay! avatar 18.3.2009 06:24 Fluttershy, yay! | skóre: 92 | blog:
Rozbalit Rozbalit vše Re: Lokalizace aplikací, Gettext
Odpovědět | Sbalit | Link | Blokovat | Admin
Přidán odkaz do wiki skupiny Překlady, klidně to tam mohlo vyjít jako článek.
🇵🇸Touch grass🇺🇦 ✊ no gods, no masters
18.3.2009 10:40 l4m4
Rozbalit Rozbalit vše Re: Lokalizace aplikací, Gettext
Odpovědět | Sbalit | Link | Blokovat | Admin
Generování ISO 8859 locales mělo raději zůstat v tom roce 2004, dnes už bych takové kostlivce nevytahoval.
20.3.2009 09:00 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Lokalizace aplikací, Gettext
Odpovědět | Sbalit | Link | Blokovat | Admin
Také mám tady jednoho takového kostlivce, z října r. 2006..

Blogpostový pidiseriál Linuxové překladatelské nástroje 1,2,3,4,5

Založit nové vláknoNahoru

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.