Desktopové prostředí Budgie bylo vydáno ve verzi 10.10. Dokončena byla migrace z X11 na Wayland. Budgie 10 vstupuje do režimu údržby. Vývoj se přesouvá k Budgie 11. Dlouho se řešilo, v čem bude nové Budgie napsáno. Budgie 10 je postaveno nad GTK 3. Přemýšlelo se také nad přepsáním z GTK do EFL. Budgie 11 bude nakonec postaveno nad Qt 6.
OpenChaos.dev je 'samovolně se vyvíjející open source projekt' s nedefinovaným cílem. Každý týden mohou lidé hlasovat o návrzích (pull requestech), přičemž vítězný návrh se integruje do kódu projektu (repozitář na GitHubu). Hlasováním je možné změnit téměř vše, včetně tohoto pravidla. Hlasování končí vždy v neděli v 9:00 UTC.
Byl vydán Debian 13.3, tj. třetí opravná verze Debianu 13 s kódovým názvem Trixie a Debian 12.13, tj. třináctá opravná verze Debianu 12 s kódovým názvem Bookworm. Řešeny jsou především bezpečnostní problémy, ale také několik vážných chyb. Instalační média Debianu 13 a Debianu 12 lze samozřejmě nadále k instalaci používat. Po instalaci stačí systém aktualizovat.
Na stránkách Evropské komise, na portálu Podělte se o svůj názor, se lze do 3. února podělit o názor k iniciativě Evropské otevřené digitální ekosystémy řešící přístup EU k otevřenému softwaru.
Společnost Kagi stojící za stejnojmenným placeným vyhledávačem vydala (𝕏) alfa verzi linuxové verze (flatpak) svého proprietárního webového prohlížeče Orion.
Firma Bose se po tlaku uživatelů rozhodla, že otevře API svých chytrých reproduktorů SoundTouch, což umožní pokračovat v jejich používání i po plánovaném ukončení podpory v letošním roce. Pro ovládání také bude stále možné využívat oficiální aplikaci, ale už pouze lokálně bez cloudových služeb. Dokumentace API dostupná zde (soubor PDF).
Jiří Eischmann se v příspěvku na svém blogu rozepsal o open source AdGuard Home jako domácí ochraně nejen před reklamou. Adguard Home není plnohodnotným DNS resolverem, funguje jako DNS forwarder s možností filtrování. To znamená, že když přijme DNS dotaz, sám na něj neodpoví, ale přepošle ho na vybraný DNS server a odpovědi zpracovává a filtruje dle nastavených pravidel a následně posílá zpět klientům. Dá se tedy používat k blokování reklamy a škodlivých stránek a k rodičovské kontrole na úrovni DNS.
AI Claude Code od Anthropicu lépe rozumí frameworku Nette, tj. open source frameworku pro tvorbu webových aplikací v PHP. David Grudl napsal plugin Nette pro Claude Code.
Byla vydána prosincová aktualizace aneb nová verze 1.108 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.108 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.
Na lasvegaském veletrhu elektroniky CES byl předveden prototyp notebooku chlazeného pomocí plazmových aktuátorů (DBD). Ačkoliv se nejedná o první nápad svého druhu, nepochybně to je první ukázka praktického použití tohoto způsobu chlazení v běžné elektronice. Co činí plazmové chladící akční členy technologickou výzvou je především vysoká produkce jedovatého ozonu, tu se prý podařilo firmě YPlasma zredukovat dielektrickou
… více »Pred necelým rokom magazín LinuxEXPRES publikoval článok s názvom Svobodné slovníky pro Linux, kde predstavil čitateľom viaceré slovníkové aplikácie. Častokrát dôležitejšie než pohodlnosť a efektívnosť práce s takouto aplikáciou sú však dáta, ktoré má k dispozícii. Nazdávame sa, že nezanedbateľné percento používateľov si nie je dostatočne vedomé možností a zdrojov, odkiaľ ich získať.
StarDict je jednoduchý, no svojimi funkciami plne postačujúci slovník pre platformu Linux, Windows, FreeBSD i Solaris. Zvláda vyhľadávanie vo viacerých databázach naraz, prehľadáva schránku, pre rýchlejšie vyhľadávanie používa indexáciu, rozoznáva zástupné znaky a po dodaní zvukových súborov hľadané slovo tiež prehrá na zvukovom výstupe. Existuje tiež konzolová aplikácia (sdcv), ktorá používa databázu vo formáte StarDict. Čo vám na StarDicte môže prekážať, je to, že okrem samotného dopytu nespracúva žiadne iné argumenty (použité databázy, výstup do konzoly a pod.) a tiež nemožnosť zmeny niektorých "hard-coded" nastavení (cesta pre súbory s výslovnosťou, klávesové skratky).
Samotný slovník neobsahuje po inštalácii žiadne databázy. Na stránkach projektu sa ako prvé ponúkajú free výkladové anglické slovníky (WordNet, Collins Cobuild, LongMan), ktoré ste si už pravdepodobne doinštalovali. Nie každý je však natoľko zdatný v angličtine, aby mu výkladový slovník stačil, a preto sa pozrieme na česko-anglické databázy.
Projekt GNU/FDL Anglicko-český slovník od pána Milana Svobody je dostatočne známy a netreba ho nijak zvlášť predstavovať. Ide o slovník pre voľné použitie, do ktorého môže, prostredníctvom webového rozhrania, prispievať každý (bez nutnosti registrácie). To má samozrejme svoje výhody (neologizmy, možnosť rýchlej opravy chýb a nepresností) i tienisté stránky (možné licenčné problémy či chyby v preklade). Vďaka pánovi Čihařovi a jeho blogovému zápisu možno sťahovať každý deň aktualizovanú verziu GNU/FDL slovníka vo formáte StarDict na tejto adrese. Neostáva nič iné, len poďakovať.
PC Translator od firmy LangSoft je pomerne obľúbený prekladač a to nielen v Čechách, ale i na Slovensku. Slovník je možné spustiť i pod Wine, no najnovšie verzie majú bohužiaľ problémy so zobrazovaním, čo používanie slovníka značne obmedzuje (po dvojkliknutí na výsledok vyhľadávanie sa zobrazí iba prvá možnosť). Napadlo nás, či by bolo možné skonvertovať použitú jazykovú databázu pre StarDict.
Slovníkové údaje sú uložené vo formáte DBF v3; najjednoduchšia cesta,
ako z nich vydolovať dáta, je však použiť iný spôsob než parsovanie
týchto dát. Spustite Dictionary manager (wtrdctm.exe vo Windows alebo príkazom wine wtrdctm.exe) a vyberte možnosť Zálohovanie slovníku. V inštalačnom adresári pribudne niekoľko súborov s príponami .15, .25, ..., .55. Súbory dekomprimujte a zlúčte do jednoho príkazom
zcat prvy.15, druhy.25 .. >ancs.txt
Pre ďalšie spracovanie tohto súboru sme pripravili skript, ktorý si môžete stiahnuť na tomto mieste. Okrem perlu budete potrebovať ešte binárku tabfile (src/tools tarballu stardict). Taktiež sa uistite, či máte v systéme prítomnú utilitu dictzip (balík dictd), ktorá kompresiou môže zmenšiť slovníkový súbor až o polovicu.
Rozbalený skript a súbor ancs.txt umiestnite do spoločného adresára a spustite ho spolu s dvojpísmenovým kódom jazyka ako argument. Výsledkom spustenia sú 3 súbory – ifo/diz/idx. Vytvorte pre ne adresár (názov nie je dôležitý) a skopírujte ho buď do systémového /usr/share/stardict alebo ~/.stardict/dic. V tejto chvíli by ste mali po reštartovaní StarDictu vidieť novú slovnú zásobu.
Podobným spôsobom je možné pre StarDict skonvertovať i slovník fráz. V PC Translatore sa tento zobrazí po kliknutí na nájdené slovo pravým tlačidlom myši alebo stlačení Ctrl+M. Na tento účel vám poslúži tento skript.
Momentálne možno skriptami preložiť anglickú, slovenskú, poľskú, latinskú, taliansku, francúzsku, portugalskú, španielsku, holandskú, maďarskú, ruskú a švédsku slovnú zásobu.
Pri PC Translatore stojí ešte za zmienku terminálový program českého autora s názvom dP translator, ktorý by mal podporovať slovníkové dáta PC Translatoru priamo, bez nutnosti ich konverzie. Bohužiaľ kód je už natoľko zastaralý (posledná úprava roku 1999), že sa nám ho nepodarilo úspešne skompilovať.
Pomocou skriptu vyslovnost.py si môžete vygenerovať zo súborov *.cmp v inštalačnom adresári Translatora audiosúbory s výslovnosťou. Postup je nasledujúci: v adresári s inštalačnými súbormi spustite príkaz
dbf --csv reader.out readera.dbf
v skripte vyslovnost.py upravte cestu, kam sa majú audiosúbory ukladať, a spustite python vyslovnost.py. Hotový adresár so súbormi presuňte do /usr/share.
PC Translator používa výslovnosť vo formáte Ogg komprimovaný speex kodekom. Kvalita nahrávok sa nám nepríliš pozdáva, prekážala nám predovšetkým veľmi slabá intonácia. Odporúčame preto stiahnutie WyabdcRealPeopleTTS – voľne dostupného balíku s wav súbormi, ktoré sa počúvajú oveľa lepšie, a ich vzájomné skombinovanie: teda na miesto s uloženými súbormi skopírujte a potvrďte prepísanie súborov s rovnakým názvom. Posledná úprava, ktorú treba vykonať, je nastavenie skriptu pre prehrávanie súborov. Buď v nastavení StarDictu zadáte program, ktorý zvláda prehranie .wav i .ogg súborov (MPlayer si bohužiaľ s wav súbormi o tak nízkom bitrate neporadí), alebo použite tento bashový skript.
Tým používateľom, ktorí majú disk formátovaný malými blokmi či súborový systém optimalizovaný pre malé súbory, takmer 50 000 súborov na disku nebude prekážať. Pre ostatných len toľko: ak výslovnosť nepotrebujete, neinštalujte ju. A ak ju potrebujete, tak vám snáď aspoň malou kompenzáciou bude fakt, že môžete so súbormi svojvoľne pracovať – napríklad si môžete nechať iba niektoré alebo si nahovoriť vlastné. Len pre predstavu: vyššie opísaným postupom vytvorený adresár má zatarovaný (čiže uložený v jednom súbore bez kompresie) necelých 190 MB.
Universal Dictionary je projekt, ktorého cieľom je vytvoriť slovník, ktorý by vzájomne prepájal hneď niekoľko jazykov naraz. Princíp fungovania slovníka možno najlepšie pochopiť zo stránok projektu. Rovnako ako pri GNU/FDL slovníku i tento rastie vďaka komunite dobrovoľných prekladateľov. Na internete sme objavili pythonový skript, ktorým možno bilinguálne preklady vygenerované na stránke www.dicts.info/uddl.php prekonvertovať do StarDictu a upravili sme ho tak, aby mu nerobili problémy riadky s 3 stĺpcami.
WT-slovník je freewarový anglicko-slovenský slovník s približne polovičnou slovnou zásobou GNU/FDL. Po konverzii z databázy MS Access na plaintext môžete použiť nasledovný skript a pomocou tabfile vytvoriť z vygenerovaného súboru slovníkové súbory pre StarDict. Súbory .ifo si musíte „vyrobiť“ sami – stačí, ak sa inšpirujete už jestvujúcimi súbormi v /usr/share/stardict/dic. Hodnotu wordcount vypíše tabfile.
Slovníky Millennium sú k dispozícií na stiahnutie na stránkach fy Commercial Service, s.r.o. a to vo všetkých verziách. Základná verzia je free, ostatné sú funkčné po dobu 30 dní, pre dlhšiu dobu používania je potrebné kúpiť odblokovací kľúč.
Konverzia je možná, no postup trochu kontroverzný, a tak sme sa rozhodli nakoniec neuverejňovať návod. Asi by to nebolo úplne férové. Každopádne zverejňujeme skript pre tých, ktorý si nedajú pokoj a ochranu Access databázy (mdb) nejakým spôsobom obišli (funguje pre všetky jazykové verzie i úrovne slovníkov).
Jeden z autorov StarDictu tvrdí, že sa mu podarilo zistiť spôsob, akým sú ukladané heslá v databáze slovníkov Babylon. Na predídenie potenciálnym licenčným problémom sa však rozhodol ho nepublikovať. Mnoho ďalších free slovníkov pre platformu Windows možno nájsť napríklad na stránkach slunecnice.cz a tak môžete pokúšať šťastie s ich spúšťaním pod Wine. To už je ale téma na iný článok.
Na slunecnice.cz sme objavili tiež free slovník iTranslator, ktorý síce (zatiaľ) nefunguje pod Linuxom, no zaujímavý je predovšetkým slovnou zásobou (cca 400 000 slov). Databáza je uložená v sqlite3, takže jej spracovanie je prakticky triviálne. V plaintext formáte má potom uložené dáta tiež slovník Slovník 1.6 s necelými 150 000 záznamami.
Aj keď sa to už cudzojazyčných slovníkov príliš netýka, občas
sa môže hodiť aj slovník cudzích slov. Jeden taký, určený pre Palm (a
teda dosť skromný), je Slovník cizích slov. Pretože ide o obyčajný Palm dokument (.pdb), je konverzia veľmi jednoduchá a zmestí sa doslova na jeden riadok:
txt2pdbdoc -d scs.pdb | grep " - " | sed "s/ - /\t/" | tr -d '"' | \
iconv -f cp1250 -t utf8 >out; tabfile out
Príslušný .ifo súbor si musíte pripraviť sami.
Na záver porovnanie veľkosti slovnej zásoby pre popisované slovníky (hodnota wordcount – teda počet unikátnych hesiel) – výkladové slovníky a dvojjazyčné smer anglicko-český:
| Názov slovníka | Odkaz | Wordcount | Cena (v Kč bez DPH) |
| The Britannica Concise | www.britannica.com | 24 402 | free |
| Collins Cobuild | collins.co.uk | 34 097 | free |
| WordNet | wordnet.princeton.edu | 149 535 | free |
| Oxford Advanced Learner's | oup.com/elt/oald | 34 153 | free |
| Merriam Webster 10th | m-w.com | 20 517 | free |
| Longman - Contemporary English | longman.com/ldoce | 43 052 | free |
| GNU/FDL k 13. 6. 2006 | slovnik.zcu.cz | 84 209 | free |
| PC Translator 2005 | translator.cz | 408 243 | 3 750 |
| Universal Dictionary k 13. 6. 2006 | dicts.info | 16 674 | free |
| WT-slovník (ang-sk) | slovnik.wtsba.sk | 46 674 | free |
| Millennium Profi | pc-slovniky.cz | 945 772 | 12 800 |
Pozn. Mnoho ďalších anglických výkladových slovníkov pre StarDict možno stiahnuť zo stránky XDXF Dictionaries Download.
Screenshot bežiaceho programu (PNG, 85 kB)
Veríme, že informácie obsiahnuté v článku boli pre vás zaujímavé a užitočné a že argument o nedostatku kvalitných slovníkov pre Linux je pre väčšinu z vás už minulosťou. Ak máte tipy na ďalšie slovníky, prosím zmieňte sa o nich v diskusii.
Niektoré postupy pri konverzii predovšetkým komerčných slovníkov bohužiaľ vyžadujú použitie closed-source software (MS Windows, MS Access), prípadne sama oprávnenosť konverzie môže byť rozporuplná. Z tohto dôvodu sme sa rozhodli postupy nezverejňovať a nechať všetko na vôli a schopnostiach používateľa. Dúfame, že netreba nijak zvlášť prízvukovať, že slovníky vygenerované z komerčných databáz nie sú určené na publikovanie kdekoľvek na internete či inými prostriedkami.
Za nečistosť či neefektivitu skriptov sa ospravedlňujeme – ani jeden z nás nie je zameraním programátor, navyše sa domnievame, že prevod slovníka je jednorazový proces, a tak sa perličkovaním a šperkovaním do dokonalosti nechceme zaoberať.
Veľa úspechov pri objavovaní krás cudzích jazykov prajú autori článku,
PS: Radi by sme poďakovali Vítovi Pelčákovi aka Belisarivsovi za pomoc pri nezávislom testovaní skriptov.
Nástroje: Tisk bez diskuse
Tiskni
Sdílej:
)
Před pár dny jsem přidal do AURu PKGBUILDy pro LongMana a GNU/FDL Anglicko-Český slovník, takže uživatelé Arch Linuxu je mohou využít.
.
mv $1-cz-dict.txt $1-cz-dictionary.txt mv cz-$1-dict.txt cz-$1-dictionary.txt rm en-cz-dictionary.txt cz-en-dictionary.txt echo "Vytvaram data pre StarDict slovnik ..." for slovnik in $1"-cz-dictionary.txt" "cz-"$1"-dictionary.txt"se mi zdalo tak jako zcestne, tak jsem zakomentoval tu radku s
rm a uz se to v pohode vytvorilo. Ze by bug?
----
Vytvaram zoznam cudzojazycnych vyrazov...anglictina
Vytvaram zoznam ceskych vyrazov...
Vytvaram zoznam typov...
Vytvaram slovnikove udaje pre oba smery...
Traceback (most recent call last):
File "merge_dict.py", line 21, in ?
dictionary.write(en[:-1])
NameError: name 'en' is not defined
Vytvaram data pre StarDict slovnik ...
ls: en-cz-dictionary.txt.idx: není souborem ani adresářem
ls: cz-en-dictionary.txt.idx: není souborem ani adresářem
Skopirujte subory s priponou .ifo, .dict a .idx do /usr/share/stardict/dic/transl alebo ~/.stardict/dic/transl
rm: cannot remove `en-cz-dictionary.txt': není souborem ani adresářem
rm: cannot remove `cz-en-dictionary.txt': není souborem ani adresářem
----
Muzete mi prosim pomoci? Kde mam chybu? Dekuji, Honza.
Skusal som ten skript (pre translator) v systeme s kodovanim utf8a práve tu imo bude Váš problém.. (viď odpoveď vyššie)
zcat ANCSZAL.15 ANCSZAL.25 ANCSZAL.35 ANCSZAL.45 ANCSZAL.55 > ancs.txt
2) Přepnul jsem v konzoli kodování na ISO8859-2:
export LC_ALL=cs_CZ.ISO-8859-2
3) Ve skriptu conv.sh jsem zakomentoval pomocí # řádek 38:
#rm en-cz-dictionary.txt cz-en-dictionary.txt
4) Spustil jsem
./convert.sh en
5) Vznikly mně tyto soubory:
cz-en-dictionary.txt.dict.dz
cz-en-dictionary.txt.idx
cz-en-dictionary.txt.ifo
en-cz-dictionary.txt.dict.dz
en-cz-dictionary.txt.idx
en-cz-dictionary.txt.ifo
Ty jsem nakopíroval do /usr/share/dict/. Problém je, že v StarDictu nejsou slovíčka EN propojena s CZ a naopak... Zkrátka to hledá anglická slovíčka v anglickém seznamu slov bez toho, že by se zobrazoval překlad do CZ.
Poradíte někdo? Díky.
Ja bych jeste zkusil (docasne) odskrtnout vsechny slovniky krome jednoho testovaneho (je to v nastaveni slovniku) a pak bych zadaval slova.Jo, to jsem samozřejmě zkoušel. Ale jak píšu výše, zobrazí se jen hledané slovíčko, nikoliv jeho jinojazyčný protějšek...
export ZALOHA=$LANG export LC_ALL=cs_CZ.ISO-8859-2a na koniec
export LC_ALL=$ZALOHAnie som ziadny linux-guru, ale myslim, ze to pomoze vyriesit problem kodovania ISO8859-2 vs. 'hocico' a tiez presunut riadok pred vytvaranim stardict slovnika
rm en-cz-dictionary.txt cz-en-dictionary.txtna koniec skriptu, aby nebolo potrebne komentovat ho osobitne pre anglicky jazyk
1. vytvoril som ancs.txt z tych asi 5 suborov
2.mam syst. s utf8 a tak som kvoli iso8859-2 pouzil knoppix (asi 3.7) a spustil ten skript ./convert.sh en , nezakomentovaval som nic ale je lepsie asi zakomentovat riadky kde je rm foreign.txt czech.txt type.txt aby sa vytvorili a nezmazali (musel som stihnut skopirovat ich pred vymazanim
). vytvorili sa aj .ifo subory.(V knoppixe vypisalo chybu ze mu nieco chyba. Ale to je nepodstatne.)
3. potom som pouzil skript python merge_dict.py a z foreign.txt czech.txt type.txt sa vytvorili en-cz-dictionary.txt a cz-en-dictionary.txt
4.prikazom ./tabfile en-cz.dictionary.txt a ./tabfile cz-en...txt sa vytvorili .dz a .idx subory pre oba smery slovnika. Prikaz nesmie skoncit chybou. Ak skonci, treba odstranit nevhodne znaky z jednotlivych riadkov. Vacsinou mu vadi znak / . Prikaz vypise wordcount-y . (tabfile som pouzil originalny - po skompilovani stardictu)
5. .ifo subory vytvorene v kroku 2 som doplnil: wordcount-y su z bodu 4 a idxfilesize sa zisti prikazom ls -l en-cz-dictionary.idx (a aj pre cz-en-dictionary.idx)
6.treba nakopirovat .dz .idx. .ifo sub. napr. do /usr/share/stardict/example-dict
7.Na overenie ci je slovnik spravne vytvoreny treba pouzit prikaz ./stardict_verify /cestakslovniku/vytvoreny_subor.ifo stardict_verify sa nachadza v adresari /src/tools po skompilovani stardictu.
8.hotovo.ako zadefinujem wordcounty pre novovytvorne subory.riadok wordcount= v .ifo súbore
Inac je to ok ked wc anglickeho je iny ako wc slovenskeho?je to úplne OK. príklad slovníka: dog=pes;kamarát. wordcount pre anglicko-slovenský slovník: 1, opačne 2.
tr -d '"' <subor.txt | iconv -f iso8859-1 -t utf-8 >slovnik.txt; tabfile slovnik.txtpotom vytvorte .ifo súbor.
perl -pe 's/#(.*?) (.*?) *\[.....\] :: (.*)/\1\t< \ span size="smaller" color="darkseagreen">\2<\/span> \3/' DICTPAGE.RAW >\ latin-english.txt ./tabfile latin-english.txtpotom už len stačí v ifo súbore zmeniť sametypesequence z m na g a vytvoriť pre nový slovník adresár v ceste so slovníkmi StarDictu.
#!/bin/bash # give the downloaded file a zip extension and within the archive locate # the file containing the word database # preview it and according to its content uncomment one of the lines #perl -pe "s/^ (.*?) : (.*?) :/\1\t\2/" "$1" | cstocs il1 utf8 >jdict-"$1" #perl -pe "s/^ (.*?) \| (.*?) \|/\1\t\2/" "$1" | cstocs il1 utf8 >jdict-"$1" ./tabfile jdict-"$1"
tr -d '\r' < Interlingua_English | awk 'getline a {print $0"\t"a} getline b {}'
#!/bin/bash
tr -d '\r' < "$1" | awk 'getline a {print $0"\t"a} getline b {}' \
| cstocs il1 utf8 | sed -e "s/<br>//gi" -e "s/<hr>//gi" \
| vi -c ":%s/<\([^>]*\)>/<\L\1>/g" -c ":w! jdict-$1" -c ":q" -
./tabfile jdict-"$1"
dbview -bt -d\; file.dbf | awk -F\; '{print $1 "\t" $3 " " $4}' | iconv -f ibm852 -t utf-8 >file.out