Na webu konference Den IPv6, která se konala 4. června v Národní technické knihovně v pražských Dejvicích, jsou nyní k dispozici všechny prezentace (v PDF) a jejich videozáznamy. Organizátory konference byly i letos sdružení CESNET, CZ.NIC a NIX.CZ.
Byla vydána nová verze 9.1.0 správce sbírky fotografií digiKam (Wikipedie). Přehled novinek i s náhledy v oficiálním oznámení (NEWS). Vypíchnout lze vylepšené vyhledávání nebo podporu Pixel Motion Photos. Nejnovější digiKam je ke stažení také jako balíček ve formátu AppImage. Stačí jej stáhnout, nastavit právo ke spuštění a spustit.
Přihlaste svou přednášku na další ročník konference LinuxDays, který proběhne 3. a 4. října na FIT ČVUT v pražských Dejvicích. Příjem témat poběží do konce prázdnin, pak proběhne veřejné hlasování a následně sestavení programu.
Byla vydána nová verze 2.4.68 svobodného multiplatformního webového serveru Apache (httpd). Řešeno je mimo jiné 13 zranitelností.
Apple na své vývojářské konferenci WWDC26 (Worldwide Developers Conference, keynote) představil řadu novinek. Vypíchnout lze novou generaci Apple Intelligence a zbrusu novou Siri, která dostala název Siri AI. Kvůli Aktu o digitálních trzích (DMA) však funkce Siri AI nebudou v systémech iOS 27 a iPadOS 27 k dispozici uživatelům v Evropské unii.
Byla vydána nová verze 1.18.0 distribučního frameworku Flatpak (Wikipedie), tj. technologie umožňující distribuovat aplikace v podobě jednoho instalačního souboru na různé linuxové distribuce a jejich různá vydání. Přehled novinek na GitHubu. Vypíchnout lze podporu rozhraní /dev/kfd pro výpočty na kartách AMD (AMDKFD).
aMule (Wikipedie), tj. multiplatformní klient pro peer-to-peer sdílení souborů pro sítě eD2k and Kademlia, byl po více než pěti letech od vydání poslední verze 2.3.3, vydán v nové major verzi 3.0.0 (GitHub). S novou webovou stránkou a dokumentací.
Byly vyhlášeni vítězové a zveřejněny vítězné zdrojové kódy (YouTube, GitHub) již 29. ročníku soutěže International Obfuscated C Code Contest (IOCCC), tj. soutěže o nejnepřehlednější (nejobfuskovanější) zdrojový kód v jazyce C.
Evropská komise předložila evropský balíček pro technologickou suverenitu, tedy soubor opatření, která mají posílit kapacity EU v oblasti polovodičů, umělé inteligence, cloudu a open source. To Evropě pomůže stát se lídrem v oblasti umělé inteligence, posílit její digitální autonomii a vytvářet podmínky pro udržitelnější digitální budoucnost.
OpenCV (Open Source Computer Vision, Wikipedie), tj. open source multiplatformní knihovna pro zpracování obrazu a počítačové vidění, byla vydána v nové major verzi 5.
Jsem zakladatelem tohoto portálu. Linux jsem používal spousty let, nějaký čas jsem se aktivně podílel na jeho propagaci v Česku (CZLUG, časopisy ComputerWorld, Network Magazine atd). Se současným Abíčkem už nemám nic společného.
Již dlouho plánuji nasadit ve vyhledávání stemmer. To je nástroj, který převede slovo do prvního pádu jednotného čísla. Vyspělé vyhledávací enginy jim disponují. Zatím mám ale problém s nalezením vhodného stemmeru. Pro javu existuje egothor, ale ten nemá slovník (seznam slov a jejich možných pádů). V Linuxu existuje například aspell, který slovník má, ale neměl jsem čas studovat jeho binární formát. Snad mají někde (v CVS?) vystaven zdrojový soubor, ale na webu jsem jej nenašel. I kdyby formát byl čitelný a mohl jsem jej použít v egothoru, bude zde problém s licencí - GPL. To silně omezuje možnosti využití jen na programy licencované GPL. Abíčko to sice splňuje, ale když už tím budu trávit čas, proč nevytvořit kompletní knihovnu použitelnou i v programech s jinými licencemi? Ve světě Javy je zvykem používat svobodné licence typu BSD, které neomezují programátory.
Moje výzva zní:
znáte-li české slovníky, prosím vložte sem na ně odkazy i s informací o licenci. Třeba už takový slovník existuje. Pokud neexistuje, myslíte, že by mělo smysl napsat webový nástroj pro vytváření slovníku? Jednoduchý formulář, kde byste zadali slovo ve všech pádech a případně přidali doplňující informace (rod, zda je slovo pomnožné, nepravidelné atd). Určitě by se dala naplnit databáze nepřeloženými slovy a na abíčku na každé stránce zobrazovat žádost o doplnění. Možná jsem naivní, ale během roku by se takto dala vytvořit databáze s desitkami tisíc slov. Zvláště pokud by se zapojili jazykovědci. Výstupem by byla svobodná databáze českých slov s jejich skloňováním. Ale třeba už existuje na nějakém ústavě, jen se o ni neví.
Tiskni
Sdílej:
This data file and the enclosed Czech dictionary files for ispell are free software; you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation; either version 2 of the License, or (at your option) any later version (see /usr/share/common-licenses/GPL).Někde na netu se dá najít i javovský parser pro ispell.
org.apache.lucene.analysis.zip. Je to nový Analyzer a StemFilter do Lucene, využívá právě slovníku ispellu. Bude to chtít ale upravit (verze je hodně stará a třeba načítání všech pravidel do pole určitě ideální není). Jo, a pamatuju si, že tam někde zlobilo parsování pravidel (třída Rule nebo Rules). Ve slovníku byl použit tabulátor, parser ale hledal mezery…
Jak jsem psal v zápisku o StarDictu, používám GNU/FDL Anglicko-Český slovník. Otázka ale je, jak moc užitečný by byl pro výše uvedené užití.
Já se tak rozhodl už dávno, že GPL licencovanými věcmi se budu pokud možno vyhýbat při programování. Není to příliš svobodná licence pro programátory.
Uvažoval jsem, že by se zadalo slovo v prvním pádě a vybral rod.
Následně by jsi vybral ze seznamu vzorů pro tento rod a systém by automaticky doplnil zbývající
pády. Člověk by pak jen zkontroloval, zda doplnění koncovek bylo správné a pokud ne
(nebo by slovo bylo nepravidelné), tak by jednotlivé pády opravil. Odesláním formuláře by
se slovo uložilo a případně hned se objevilo další slovo čekající na skloňování. Takhle by šlo
pracovat velmi rychle a efektivně. Pro zpětnou kontrolu by existoval seznam naposledy
upravených slov, takže by jiní uživatelé mohli případně hned zajistit nápravu, kdyby si
někdo začal "hrát".
Jazykovedci niečo podobné ako ty už majú. V Brne na FI je to ajka (GNU/GPL, C), Ševeček (Lingea?) má lemmu a v Prahe sa tiež niečo nájde. Desiatky tisíc základných tvarov nie je zase až tak veľa ako by si potreboval. Používané nástroje majú databázu o rád až dva väčšiu (pre češtinu, samozrejme). Tieto databázy sa určite získať dajú, či už za peniaze, alebo barter (častejšia možnosť), žiadna z nich nie je slobodná.Máte někdo na ně kontakty? Taková databáze, kterou si na katedře kuchtí doktorand a nikdo o ni neví, je na dvě věci
Ideální je, kdyby se všichni propojili a společně vytvořili jednu dokonalou a otevřenou databázi.
My bychom jim mohli pomoci s propagací a třeba jim připravit webový nástroj na údržbu.
Takéto projekty nie je treba až tak propagovať, pretože ak to niekto potrebuje komerčne, tak sa o nich vcelku jednoducho dozvie. Ak sa vymyslí spôsob, ktorý bude prínosný aj pre tých, ktorí tie dáta majú, tak sa určite dohodnúť dá.Chci se o nich dozvedet adohodnout se. Nerad bych zacinal na prazdne louce. I deset tisic nejpouzivanejsich slov by abicku pomohlo rozjet stemming.
(prostě, pro open-source filosofii je tenhle úkol asi už značná výzva).
Asi by bylo fajn, kdyby ta aplikace/webovka třeba sama nabídla z různých možností.
Nicméně, pokud by se zadařilo, je tu podle mého názoru jistá možnost, že by to zajímalo i subjekty, které jsou jinak nuceny používat komerční řešení.
Ale mám skoro pocit, že o tomhle jsem se tady někde už jednou taky vyjadřoval.
))
Takhle uzivateli zadam druhy pad mnozneho cisla slova hrad, robot mi odpovi #4%@ a abicko potvrdi zalozeni uzivatele a zaroven tento nesmysl ulozi do databaze jako druhy pad slova hrad. Mozna by to slo na pouzit na overovani spravnosti existujicich udaju. Ale neshoda s ocekavanymi daty vnasi nejistotu - spletl se uzivatel captcha nebo autor pojmu? Navic by zde mohla byt diskriminace Slovaku, ne kazdy z nich asi bude dokonale ovladat cestinu. Takze tento napad je zajimavy, ale nasazeni v praxi je problematicke.
Technika je popsána zde.
cat slovak.words | ispell -e -d slovak | tr " " "\n" >slovak.word.list