Společnost OpenAI představila GPT-5 (YouTube).
Byla vydána (𝕏) červencová aktualizace aneb nová verze 1.103 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.103 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.
Americký prezident Donald Trump vyzval nového generálního ředitele firmy na výrobu čipů Intel, aby odstoupil. Prezident to zdůvodnil vazbami nového šéfa Lip-Bu Tana na čínské firmy.
Bylo vydáno Ubuntu 24.04.3 LTS, tj. třetí opravné vydání Ubuntu 24.04 LTS s kódovým názvem Noble Numbat. Přehled novinek a oprav na Discourse.
Byla vydána verze 1.89.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.
Americká technologická společnost Apple uskuteční v USA další investice ve výši sta miliard dolarů (2,1 bilionu korun). Oznámil to ve středu šéf firmy Tim Cook při setkání v Bílém domě s americkým prezidentem Donaldem Trumpem. Trump zároveň oznámil záměr zavést stoprocentní clo na polovodiče z dovozu.
Zálohovací server Proxmox Backup Server byl vydán v nové stabilní verzi 4.0. Založen je na Debianu 13 Trixie.
Byla vydána nová verze 1.54.0 sady nástrojů pro správu síťových připojení NetworkManager. Novinkám se v příspěvku na blogu NetworkManageru věnuje Jan Václav.
Knižní edice správce české národní domény přináší novou knihu zkušeného programátora Pavla Tišnovského s názvem Programovací jazyk Go. Publikace nabízí srozumitelný a prakticky zaměřený pohled na programování v tomto moderním jazyce. Nejedná se však o klasickou učebnici, ale spíše o průvodce pro vývojáře, kteří s Go začínají, nebo pro ty, kdo hledají odpovědi na konkrétní otázky či inspiraci k dalšímu objevování. Tištěná i digitální verze knihy je již nyní k dispozici u většiny knihkupců.
OpenAI zpřístupnila (en) nové nenáročné otevřené jazykové modely gpt-oss (gpt-oss-120b a gpt-oss-20b). Přístupné jsou pod licencí Apache 2.0.
Kostlivec z roku 2004, začátek nedopsaného seriálu, třeba se to bude někomu do začátků hodit... Jak lokalizovat (překládat) aplikace. Jak psát lokalizovatelné aplikace. Použití standardních nástrojů. Příklady pro Python, C, Glade, Bash.
Podíváme se, pro jaké jazyky máme vygenerované locales.
$ locale -a
C
cs_CZ
cs_CZ.iso88592
czech
POSIX
Budeme-li chtít vygenerovat další locales, upravíme /etc/locale.gen
.
en_US ISO-8859-1
cs_CZ ISO-8859-2
sk_SK ISO-8859-2
a spustíme skript locale-gen
.
# locale-gen
Generating locales...
en_US.ISO-8859-1... done
cs_CZ.ISO-8859-2... done
sk_SK.ISO-8859-2... done
Generation complete.
Tento skript smaže staré locale data v /usr/lib/locale
a
vygeneruje nové dle výše zmiňovaného konfiguračního souboru. Např. pro náš
jazyk spustí.
localedef -i cs_CZ -c -f ISO-8859-2 -A /etc/locale.alias cs_CZ
Program by měl nejprve číst proměnnou $LC_ALL
. Když nic
neobsahuje, přečte nastavení z proměnných (umožňují různorodé nastavení jednotlivých
kategorií) uvedených v následujícím výpisu. Teprve poté použije případně proměnnou
$LANG
.
$ locale
LANG=cs_CZ
LC_CTYPE="cs_CZ"
LC_NUMERIC="cs_CZ"
LC_TIME="cs_CZ"
LC_COLLATE="cs_CZ"
LC_MONETARY="cs_CZ"
LC_MESSAGES="cs_CZ"
LC_PAPER="cs_CZ"
LC_NAME="cs_CZ"
LC_ADDRESS="cs_CZ"
LC_TELEPHONE="cs_CZ"
LC_MEASUREMENT="cs_CZ"
LC_IDENTIFICATION="cs_CZ"
LC_ALL=
$ date
So kvě 1 16:34:49 CEST 2004
$ LC_ALL=C date
Sat May 1 16:34:57 CEST 2004
V případě, že nejsou nalezeny příslušné soubory (nebo je hodnota proměnné
C
), použijí se řetězce zakompilované v programu. Proměnné předáváme
hodnotu v následujícím formátu (případně můžeme použít přezdívku definovanou v
/etc/locale.alias
).
jazyk[_země][.znaková sada]
(např. cs_CZ.ISO-8859-2)
Překlad textových řetězců pro MC nalezname v binárním souboru
/usr/share/locale/cs/LC_MESSAGES/mc.mo
. V původní textové
podobě ho můžeme získat následujícím příkazem.
$ msgunfmt /usr/share/locale/cs/LC_MESSAGES/mc.mo > mc.po
Podívejte se na obsah získaného souboru.
msgid ""
- původní řetězec ze zdrojového kódumsgstr ""
- přeložený řetězec#
- komentář#:
- odkaz na umístění ve zdrojovém kódu#,
- informují o stavu překladu nebo formátuMáme následující skript v Pythonu l10n1-python.py a XML soubor z Glade l10n1-python.glade.
#!/usr/bin/python -d # -*- coding: utf-8 -*- import gtk import gtk.glade import gettext gettext.bindtextdomain('l10n1-python', '/usr/share/locale') gettext.textdomain('l10n1-python') gtk.glade.bindtextdomain('l10n1-python', '/usr/share/locale') gtk.glade.textdomain('l10n1-python') _ = gettext.gettext xml = gtk.glade.XML('l10n1-python.glade', 'window') def spustit(button): info_LB.set_text(_("Complete.")) def quit(window): gtk.main_quit() print _("End...") xml.signal_autoconnect(locals()) info_LB = xml.get_widget("info_LB") gtk.main()
Na začátku definujeme, kde se má hledat MO soubor a veškerý text,
který budeme chtít přeložit, umístíme do _(""). Nyní vytvoříme katalog,
otevřeme si ho v našem oblíbeném editoru, provedeme překlad a nezapomeneme
definovat kódování atp. na začátku katalogu. Poté soubor s překladem
převedeme do binárního tvaru a zkopírujeme do /usr/share/locale/
.
$ xgettext l10n1-python.py l10n1-python.glade -o l10n1-python.po
$ vim l10n1-python.po
$ msgfmt l10n1-python.po -o l10n1-python.mo
# cp ./l10n1-python.mo /usr/share/locale/cs/LC_MESSAGES/l10n1-python.mo
Vyzkoušíme, jestli vše funguje.
$ LC_ALL=C ./l10n1-python.py
End...
$ LC_ALL=cs_CZ ./l10n1-python.py
Konec...
#include <locale.h> #include <libintl.h> #define PACKAGE "l10n1-program" #define LOCALEDIR "/usr/share/locale" #define _(str) gettext(str) int main(void) { setlocale(LC_ALL,""); bindtextdomain(PACKAGE, LOCALEDIR); textdomain(PACKAGE); printf(_("Hello World.\n")); printf(_("Dir: %s\n"), LOCALEDIR); exit(0); }
U céčkových programů hledá implicitně xgettext
ve zdrojovém
kódu klíčové slovo gettext
, ale my používáme kratší _
.
$ xgettext --keyword=_ l10n1-program.c -o l10n1-program.po
#!/bin/bash
TEXTDOMAINDIR=/usr/share/locale
TEXTDOMAIN=l10n1-bash
echo $"Hello World."
printf $"Dir: %s\n" $TEXTDOMAINDIR
První příkaz získá ze skriptu řetězce pro překlad a druhý přidá hlavičku katalogu.
$ bash --dump-po-strings l10n1-bash.sh > l10n1-bash.po
$ xgettext l10n1-bash.po -o l10n1-bash.po
Další nasměrování => po-mód v Emacsu, plugin po.vim ve Vimu a program KBabel.
Tiskni
Sdílej:
Glibc6 používá thread safe funkce, gettext je součást této knihovny, takže by na tom měl být v současné době stejně, s vyjímkou volání fce setlocale(), která z důvodů náročnosti není thread safe:
3.19. bonnie reports that char i/o with glibc 2 is much slower than with libc5. What can be done?
4.2 Triggering gettext Operations
Díky makru HAVE_PER_THREAD_LOCALE
lze od roku 2005 používat v různých vláknech různé nastavení locales:
fix for multithreaded gettext() tests
Funkce gettext() vrací ukazatel na string, který je staticky alokovaný a nesmí se tedy měnit ani uvolňovat (man 3 gettext
):
If a translation was found in one of the specified catalogs, it is converted to the locale’s codeset and returned. The resulting string is statically allocated and must not be modified or freed. Otherwise msgid is returned.
Pro podrobnosti mrkni do zdrojáků glibc...
mmap()
a soubor *.mo se namapuje do paměti, viz glibc-2.7/locale/loadlocale.c
a fce _nl_load_locale()
.