Portál AbcLinuxu, 2. května 2025 20:52

Linuxové překladatelské nástroje II.

3.10.2006 15:23 | Přečteno: 1693× | Za vším hledej Linux

V předchozím pojednání jsem se pokusil nastínit základní problematiku LOCALES a jejich významu. Nyní bych rád - pokud možno ve stručnosti - popsal první ze dvou nejobvyklejších systémů lokalizace.

Lokalizace přes PO soubory (gettext)

Tento způsob lokaliyace využívá kromě operačního systému např. také GTK2.
Aby bylo možné aplikaci lokalizovat, je třeba nejprve vytáhnout z jejích zdrojových kódů přeložitelné řetězce. Dělá se to např. přes aplikaci xgettext, které předhodíme seznam souborů (tento soubor se seznamem se obvykle nazývá POTFILES.in), které tyto řetězce obsahují. Vygenerovanému souboru se pak dává přípona POT. POT soubor se liší od po souboru v podstatě jen tím, že v něm jsou řetězce msgstr a některé položky v hlavičce prázdné.

Příklad vygenerování POT souboru:

xgettext -L glade -o xliffeditor.po --debug xliffeditor.glade

Výsledný soubor xliffeditor.po pak začíná nějak takhle:

# SOME DESCRIPTIVE TITLE.
# Copyright (C) YEAR THE PACKAGE'S COPYRIGHT HOLDER
# This file is distributed under the same license as the PACKAGE package.
# FIRST AUTHOR <EMAIL@ADDRESS>, YEAR.
#
#, fuzzy
msgid ""
msgstr ""
"Project-Id-Version: PACKAGE VERSION\n"
"Report-Msgid-Bugs-To: \n"
"POT-Creation-Date: 2006-01-22 14:28+0100\n"
"PO-Revision-Date: YEAR-MO-DA HO:MI+ZONE\n"
"Last-Translator: FULL NAME <EMAIL@ADDRESS>\n"
"Language-Team: LANGUAGE <pre>\n"
"MIME-Version: 1.0\n"
"Content-Type: text/plain; charset=CHARSET\n"
"Content-Transfer-Encoding: 8bit\n"

#: xliffeditor.glade:8
msgid "Transolution Xliff Editor"
msgstr ""

#: xliffeditor.glade:37
msgid "_File"
msgstr ""

Pochopitelně v něm následují další přeložitelné řetězce.
Než se soubor začne překládat, tak se přejmenuje, aby měl příponu po, a vyplní příslušné údaje v hlavičce. Některé nástroje toto dělají při založení nového katalogu (katalogem se rozumí po soubor).

Struktura po (i POT) souborů je velmi jednoduchá. Soubor kromě hlavičky obsahuje dvojice textových řetězců - originál je uvozen značkou msgid a překlad značkou msgstr. Vlastní řetězce jsou pak v obyčejných uvozovkách. Jsou však situace, kdy to nestačí a v textu je třeba rozlišit jednotné a množné číslo. To se nastaví v hlavičce, a uvození řetězců, kterých se to týká, pak vypadá trochu jinak (viz ukázka části hlavičky z po souboru):

"Plural-Forms: nplurals=3; plural=(n%10==1 && n%100!=11 ? 0 : n%10>=2 && n%10<=4 && (n%100<10 || n%100>=20) ? 1 : 2);\n"

Všem se omlouvám za odporně roztažené okno prohlížeče. Je to nastavení které používám i já a o kterém vím, že bezpečně funguje (přesvědčit se můžete třeba při manipulaci s instalačními balíky u aplikace Synaptic). Hotový přeložený po soubor připravený ke kompilaci do binární formy pak vypadá takto:

# translation of cs.po to čeština
# keny <keny@nativepeople.cz>, 2004.
# Keny Otter <keny@nativepeople.cz>, 2004.
# 
# 
msgid ""
msgstr ""
"Project-Id-Version: Synaptic v. 55\n"
"Report-Msgid-Bugs-To: \n"
"POT-Creation-Date: 2004-11-29 22:51+0100\n"
"PO-Revision-Date: 2004-12-16 11:33+0100\n"
"Last-Translator: Keny Otter <keny@nativepeople.cz>\n"
"Language-Team: cs <cs@li.org>\n"
"MIME-Version: 1.0\n"
"Content-Type: text/plain; charset=UTF-8\n"
"Content-Transfer-Encoding: 8bit\n"
"Plural-Forms:  nplurals=3; plural=(n%10==1 && n%100!=11 ? 0 : n%10>=2 && n%10<=4 && (n%100<10 || n%100>=20) ? 1 : 2);"

#  TRANSLATORS: Alias for the Debian package section "admin"
#. TRANSLATORS: Alias for the Debian package section "admin"
#: common/sections_trans.cc:12
msgid "System Administration"
msgstr "Administrace systému"

#: gtk/rgmainwindow.cc:1666
#, c-format
msgid ""
"You have %d broken package on your system!\n"
"\n"
"Use the \"Broken\" filter to locate it.You have %i broken packages on your system!\n"
"\n"
"Use the \"Broken\" filter to locate them."
msgstr ""
"Balíček %d ve vašem systému způsobuje problémy!\n"
"\n"
"K jeho nalezení použijte filtr \"Problémové balíky\".Ve vašem systému máte %i problémových balíčků!\n"
"\n"
"K jejich identifikaci použijte filtr \"Problémové balíky\"."

#: gtk/rgsummarywindow.cc:416
#, c-format
msgid "%d new package will be installed\n"
msgid_plural "%d new packages will be installed\n"
msgstr[0] "Bude instalován %d nový balíček\n"
msgstr[1] "Budou instalovány %d nové balíčky\n"
msgstr[2] "Bude instalováno %d nových balíčků\n"

Pozn.: Záměrně jsem vybral příklad běžného dialogu, víceřádkového dialogu, dialogu s plurálem a odpovídající hlavičky

Převod do binárního souboru

Hotový překlad se pak převede do binární formy. Což je soubor který má příponu mo, má stejný název jako spouštěná aplikace kterou má lokalizovat a je umístěn v adresáři pro příslušné "lokály".
Pro tento převod se používá aplikace msgfmt, které předhodíme přeložený po soubor. Výsledný binární soubor má příponu mo

Umístění binárních mo souborů

Soubory mo se nalézají v podadresáři LC_MESSAGES, který obvykle najdete pro každý jazyk v adresáři /usr/share/locale pod příslušným lokalizačním kódem. Marně byste však hledali adresář cs_CZ - i když nemohu vyloučit že ho najdete, půjde však nejspíš o symlink na adresář cs. Tam totiž hledá gettext hotovou binárku s překladem.

Výhody a nevýhody lokalizace pomocí gettextu

Nevýhodné je u po souborů, že se z nich poněkud vytrácí kontext. Proto se u překládaných řetězců používají různé komentáře, tak aby bylo možné alespoň podle původu řetězce zvolit nejvhodnější text. Naopak výhodné je, že na rozdíl od qm souborů (které používá lokalizace Qt3 a výše), lze z mo souborů poměrně jednoduše vytáhnout zpátky po soubor pomocí utility msgunfmt a jeho obsah použít pro naplnění databáze překladů.

       

Hodnocení: 80 %

        špatnédobré        

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře. , Tisk

Vložit další komentář

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.