Dle plánu certifikační autorita Let's Encrypt nově vydává také certifikáty s šestidenní platností (160 hodin) s možností vystavit je na IP adresu.
V programovacím jazyce Go naprogramovaná webová aplikace pro spolupráci na zdrojových kódech pomocí gitu Forgejo byla vydána ve verzi 14.0 (Mastodon). Forgejo je fork Gitei.
Just the Browser je projekt, 'který vám pomůže v internetovém prohlížeči deaktivovat funkce umělé inteligence, telemetrii, sponzorovaný obsah, integraci produktů a další nepříjemnosti' (repozitář na GitHubu). Využívá k tomu skrytá nastavení ve webových prohlížečích, určená původně pro firmy a organizace ('enterprise policies'). Pod linuxem je skriptem pro automatickou úpravu nastavení prozatím podporován pouze prohlížeč Firefox.
Svobodný multiplatformní herní engine Bevy napsaný v Rustu byl vydán ve verzi 0.18. Díky 174 přispěvatelům.
Miliardy korun na digitalizaci služeb státu nestačily. Stát do ní v letech 2020 až 2024 vložil víc než 50 miliard korun, ale původní cíl se nepodařilo splnit. Od loňského února měly být služby státu plně digitalizované a občané měli mít právo komunikovat se státem digitálně. Do tohoto data se povedlo plně digitalizovat 18 procent agendových služeb státu. Dnes to uvedl Nejvyšší kontrolní úřad (NKÚ) v souhrnné zprávě o stavu digitalizace v Česku. Zpráva vychází z výsledků víc než 50 kontrol, které NKÚ v posledních pěti letech v tomto oboru uskutečnil.
Nadace Wikimedia, která je provozovatelem internetové encyklopedie Wikipedia, oznámila u příležitosti 25. výročí vzniku encyklopedie nové licenční dohody s firmami vyvíjejícími umělou inteligenci (AI). Mezi partnery encyklopedie tak nově patří Microsoft, Amazon a Meta Platforms, ale také start-up Perplexity a francouzská společnost Mistral AI. Wikimedia má podobnou dohodu od roku 2022 také se společností Google ze skupiny
… více »D7VK byl vydán ve verzi 1.2. Jedná se o fork DXVK implementující překlad volání Direct3D 5, 6 a 7 na Vulkan. DXVK zvládá Direct3D 8, 9, 10 a 11.
Byla vydána verze 12.0.0 knihovny libvirt (Wikipedie) zastřešující různé virtualizační technologie a vytvářející jednotné rozhraní pro správu virtuálních strojů. Současně byl ve verzi 12.0.0 vydán související modul pro Python libvirt-python. Přehled novinek v poznámkách k vydání.
CreepyLink.com je nový zkracovač URL adres, 'díky kterému budou vaše odkazy vypadat tak podezřele, jak je to jen možné'. Například odkaz na abclinuxu.cz tento zkracovač převádí do podoby 'https://netflix.web-safe.link/logger_8oIlgs_free_money.php'. Dle prohlášení autora je CreepyLink alternativou ke zkracovači ShadyURL (repozitář na githubu), který dnes již bohužel není v provozu.
Na blogu Raspberry Pi byla představena rozšiřující deska Raspberry Pi AI HAT+ 2 s akcelerátorem Hailo-10 a 8 GB RAM. Na rozdíl od předchozí Raspberry Pi AI HAT+ podporuje generativní AI. Cena desky je 130 dolarů.
Řešení dotazu:
jinak v mkv by vzdy mely byt titule utf8 a prehravac uz si to sam nejak prekonvertujeAha, myslím, že tohle je ta zásadní informace. V XBMC mám nastaveno, že titulky jsou v CP1250, ale podle toho, co píšete, se to týká jen titulků v externím souboru. Tím by byl problém vyřešen. Ještě to otestuju. Jirka
a kdyz jeste pouzijes enca, tak se kodovani v srt samo uhadneJak moc spolehlivé to vlastně je? Kdysi jsem si na to psal vlastní tool jen tak cvičně a pro čtení se to chytalo docela dobře. Cokoli co lze číst jako utf-8 bylo většinou skutečně utf-8 nebo jeho podmnožina. Trochu horší byla osmibitová kódování, kde nebylo moc možné určit kódování bez odhadování jazyka, i když pro čtení taky celkem v pohodě. Trochu horší je odhadovat skutečné kódování, pokud by člověk chctěl zapisovat a zachovat ho, tam je to často nemožné a jinak dost obtížné.
enca --list languages
belarussian: CP1251 IBM866 ISO-8859-5 KOI8-UNI maccyr IBM855 KOI8-U
bulgarian: CP1251 ISO-8859-5 IBM855 maccyr ECMA-113
czech: ISO-8859-2 CP1250 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
estonian: ISO-8859-4 CP1257 IBM775 ISO-8859-13 macce baltic
croatian: CP1250 ISO-8859-2 IBM852 macce CORK
hungarian: ISO-8859-2 CP1250 IBM852 macce CORK
lithuanian: CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce baltic
latvian: CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce baltic
polish: ISO-8859-2 CP1250 IBM852 macce ISO-8859-13 ISO-8859-16 baltic CORK
russian: KOI8-R CP1251 ISO-8859-5 IBM866 maccyr
slovak: CP1250 ISO-8859-2 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
slovene: ISO-8859-2 CP1250 IBM852 macce CORK
ukrainian: CP1251 IBM855 ISO-8859-5 CP1125 KOI8-U maccyr
chinese: GBK BIG5 HZ
none:
enca vyzaduje, abys rekl, co to je za jazykTak to je dost na hovno a stálo by za vylepšení. Moje ročníkovka na střední na pár řádků už nevím v jakém jazyce zvládala detekovat kódování společně s jazykem za pomoci podobné tabulky, kdy záleželo na pořadí kódování pro daný jazyk a při podmnožině několika známých kódování se použilo to, které bylo na seznamu pro daný jazyk dříve.
UTF-8 poznas snadnoS tím bych ještě souhlasil, stačí se pokusit daný bajtový řetězec jako utf-8 interpretovat a v případě úspěchu ho za utf-8 prohlásit.
soubor by mel mit na zacatku hlavicku.Ovšem toto se nebojím prohlásit za čirou idiocii. Kódování utf-8 žádnou (povinnou) hlavičku nemá, navíc hovořit o detekci kódování v kontextu toho, že jinak čistě textový soubor opatřím hlavičkou s informací o kódování, to jaksi nedává smysl. Já osobně jsem se do kódování utf-8 bez jakýchkoli hlaviček zamiloval kvůli jeho výtečným znalostem především v kontextu ASCII světa, mezi něž patří, že nad utf-8 řetězci a soubory fungují prakticky všechny operace stejně jako nad ascii souborem. Snad jedinou výjimkou jsou operace vyžadující práci s počtem znaků. Ovšem pro utf-8 opatřené nesmyslnou značkou pořadí bajtů v kódové jednotce, kterou je jediný bajt, už touto vlastností neoplývá a osobně ho tak považuju za podobný odpad jako utf-16. TL;DR verze: Nikoliv, u textových souborů v osmibitových kódováních včetně utf-8 se minimálně na unixových systémech nevyžaduje hlavička označující kódování. A můj osobní názor je, že systémy, které jen a pouze u tohoto konkrétního osmibitového kódování vyžadují speciální hlavičky v textových souborech, jsou idiotsky navržené.
Zbytek je prevazne o tom, ze se hledaji konkretni znaky, v idealnim pripade se dela neco jako frekvencni analyza(= vemes nejakej dostatecne velkej vzorek pro danej jazyk, znej si zjistis jak casto se vyskytuje ten kterej znak a pak zjistujes neznamej text)Analýza frekvence jednotlivých znaků je sice super věc na hraní, ale u detekce jazyka/kódování krátkých textů (v řádu jednotlivých vět) se mi vůbec neosvědčila, což by u detekce jazyka/kódování obecných souborů mohl být docela problém, ale pravda je, že na titulky by to stačit mohlo.
Druhý případ je řazení podle abecedy. Tam také řadící program musí rozumět použitému kódování.Pravda, akorát že nějaké řazení vznikne i z toho utf-8 a na cokoli lepšího by stejně člověk potřeboval aplikovat národní pravidla a občas i jejich úpravu pro specifické využití.
Ale jinak jo, pokud zrovna člověk nemá písmenka s diakritikou na začátcích slov, tak je to v pohodě.
Tiskni
Sdílej: