Byla vydána verze 4.0 multiplatformního integrovaného vývojového prostředí (IDE) pro rychlý vývoj aplikaci (RAD) ve Free Pascalu Lazarus (Wikipedie). Přehled novinek v poznámkách k vydání. Využíván je Free Pascal Compiler (FPC) 3.2.2.
Podpora Windows 10 končí 14. října 2025. Připravovaná kampaň Konec desítek (End of 10) může uživatelům pomoci s přechodem na Linux.
Již tuto středu proběhne 50. Virtuální Bastlírna, tedy dle římského číslování L. Bude L značit velikost, tedy více diskutujících než obvykle, či délku, neboť díky svátku lze diskutovat dlouho do noci? Bude i příští Virtuální Bastlírna virtuální nebo reálná? Nejen to se dozvíte, když dorazíte na diskuzní večer o elektronice, softwaru, ale technice obecně, který si můžete představit jako virtuální posezení u piva spojené s učenou
… více »Český statistický úřad rozšiřuje Statistický geoportál o Datový portál GIS s otevřenými geografickými daty. Ten umožňuje stahování datových sad podle potřeb uživatelů i jejich prohlížení v mapě a přináší nové možnosti v oblasti analýzy a využití statistických dat.
Kevin Lin zkouší využívat chytré brýle Mentra při hraní na piano. Vytváří aplikaci AugmentedChords, pomocí které si do brýlí posílá notový zápis (YouTube). Uvnitř brýlí běží AugmentOS (GitHub), tj. open source operační systém pro chytré brýle.
Jarní konference EurOpen.cz 2025 proběhne 26. až 28. května v Brandýse nad Labem. Věnována je programovacím jazykům, vývoji softwaru a programovacím technikám.
Na čem aktuálně pracují vývojáři GNOME a KDE Plasma? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE Plasma.
Před 25 lety zaplavil celý svět virus ILOVEYOU. Virus se šířil e-mailem, jenž nesl přílohu s názvem I Love You. Příjemci, zvědavému, kdo se do něj zamiloval, pak program spuštěný otevřením přílohy načetl z adresáře e-mailové adresy a na ně pak „milostný vzkaz“ poslal dál. Škody vznikaly jak zahlcením e-mailových serverů, tak i druhou činností viru, kterou bylo přemazání souborů uložených v napadeném počítači.
Byla vydána nová major verze 5.0.0 svobodného multiplatformního nástroje BleachBit (GitHub, Wikipedie) určeného především k efektivnímu čištění disku od nepotřebných souborů.
Pred necelým rokom magazín LinuxEXPRES publikoval článok s názvom Svobodné slovníky pro Linux, kde predstavil čitateľom viaceré slovníkové aplikácie. Častokrát dôležitejšie než pohodlnosť a efektívnosť práce s takouto aplikáciou sú však dáta, ktoré má k dispozícii. Nazdávame sa, že nezanedbateľné percento používateľov si nie je dostatočne vedomé možností a zdrojov, odkiaľ ich získať.
StarDict je jednoduchý, no svojimi funkciami plne postačujúci slovník pre platformu Linux, Windows, FreeBSD i Solaris. Zvláda vyhľadávanie vo viacerých databázach naraz, prehľadáva schránku, pre rýchlejšie vyhľadávanie používa indexáciu, rozoznáva zástupné znaky a po dodaní zvukových súborov hľadané slovo tiež prehrá na zvukovom výstupe. Existuje tiež konzolová aplikácia (sdcv), ktorá používa databázu vo formáte StarDict. Čo vám na StarDicte môže prekážať, je to, že okrem samotného dopytu nespracúva žiadne iné argumenty (použité databázy, výstup do konzoly a pod.) a tiež nemožnosť zmeny niektorých "hard-coded" nastavení (cesta pre súbory s výslovnosťou, klávesové skratky).
Samotný slovník neobsahuje po inštalácii žiadne databázy. Na stránkach projektu sa ako prvé ponúkajú free výkladové anglické slovníky (WordNet, Collins Cobuild, LongMan), ktoré ste si už pravdepodobne doinštalovali. Nie každý je však natoľko zdatný v angličtine, aby mu výkladový slovník stačil, a preto sa pozrieme na česko-anglické databázy.
Projekt GNU/FDL Anglicko-český slovník od pána Milana Svobody je dostatočne známy a netreba ho nijak zvlášť predstavovať. Ide o slovník pre voľné použitie, do ktorého môže, prostredníctvom webového rozhrania, prispievať každý (bez nutnosti registrácie). To má samozrejme svoje výhody (neologizmy, možnosť rýchlej opravy chýb a nepresností) i tienisté stránky (možné licenčné problémy či chyby v preklade). Vďaka pánovi Čihařovi a jeho blogovému zápisu možno sťahovať každý deň aktualizovanú verziu GNU/FDL slovníka vo formáte StarDict na tejto adrese. Neostáva nič iné, len poďakovať.
PC Translator od firmy LangSoft je pomerne obľúbený prekladač a to nielen v Čechách, ale i na Slovensku. Slovník je možné spustiť i pod Wine, no najnovšie verzie majú bohužiaľ problémy so zobrazovaním, čo používanie slovníka značne obmedzuje (po dvojkliknutí na výsledok vyhľadávanie sa zobrazí iba prvá možnosť). Napadlo nás, či by bolo možné skonvertovať použitú jazykovú databázu pre StarDict.
Slovníkové údaje sú uložené vo formáte DBF v3; najjednoduchšia cesta,
ako z nich vydolovať dáta, je však použiť iný spôsob než parsovanie
týchto dát. Spustite Dictionary manager (wtrdctm.exe vo Windows alebo príkazom wine wtrdctm.exe
) a vyberte možnosť Zálohovanie slovníku. V inštalačnom adresári pribudne niekoľko súborov s príponami .15, .25, ..., .55. Súbory dekomprimujte a zlúčte do jednoho príkazom
zcat prvy.15, druhy.25 .. >ancs.txt
Pre ďalšie spracovanie tohto súboru sme pripravili skript, ktorý si môžete stiahnuť na tomto mieste. Okrem perlu budete potrebovať ešte binárku tabfile (src/tools tarballu stardict). Taktiež sa uistite, či máte v systéme prítomnú utilitu dictzip (balík dictd), ktorá kompresiou môže zmenšiť slovníkový súbor až o polovicu.
Rozbalený skript a súbor ancs.txt umiestnite do spoločného adresára a spustite ho spolu s dvojpísmenovým kódom jazyka ako argument. Výsledkom spustenia sú 3 súbory – ifo/diz/idx. Vytvorte pre ne adresár (názov nie je dôležitý) a skopírujte ho buď do systémového /usr/share/stardict alebo ~/.stardict/dic. V tejto chvíli by ste mali po reštartovaní StarDictu vidieť novú slovnú zásobu.
Podobným spôsobom je možné pre StarDict skonvertovať i slovník fráz. V PC Translatore sa tento zobrazí po kliknutí na nájdené slovo pravým tlačidlom myši alebo stlačení Ctrl+M. Na tento účel vám poslúži tento skript.
Momentálne možno skriptami preložiť anglickú, slovenskú, poľskú, latinskú, taliansku, francúzsku, portugalskú, španielsku, holandskú, maďarskú, ruskú a švédsku slovnú zásobu.
Pri PC Translatore stojí ešte za zmienku terminálový program českého autora s názvom dP translator, ktorý by mal podporovať slovníkové dáta PC Translatoru priamo, bez nutnosti ich konverzie. Bohužiaľ kód je už natoľko zastaralý (posledná úprava roku 1999), že sa nám ho nepodarilo úspešne skompilovať.
Pomocou skriptu vyslovnost.py
si môžete vygenerovať zo súborov *.cmp v inštalačnom adresári Translatora audiosúbory s výslovnosťou. Postup je nasledujúci: v adresári s inštalačnými súbormi spustite príkaz
dbf --csv reader.out readera.dbf
v skripte vyslovnost.py
upravte cestu, kam sa majú audiosúbory ukladať, a spustite python vyslovnost.py
. Hotový adresár so súbormi presuňte do /usr/share.
PC Translator používa výslovnosť vo formáte Ogg komprimovaný speex kodekom. Kvalita nahrávok sa nám nepríliš pozdáva, prekážala nám predovšetkým veľmi slabá intonácia. Odporúčame preto stiahnutie WyabdcRealPeopleTTS – voľne dostupného balíku s wav súbormi, ktoré sa počúvajú oveľa lepšie, a ich vzájomné skombinovanie: teda na miesto s uloženými súbormi skopírujte a potvrďte prepísanie súborov s rovnakým názvom. Posledná úprava, ktorú treba vykonať, je nastavenie skriptu pre prehrávanie súborov. Buď v nastavení StarDictu zadáte program, ktorý zvláda prehranie .wav i .ogg súborov (MPlayer si bohužiaľ s wav súbormi o tak nízkom bitrate neporadí), alebo použite tento bashový skript.
Tým používateľom, ktorí majú disk formátovaný malými blokmi či súborový systém optimalizovaný pre malé súbory, takmer 50 000 súborov na disku nebude prekážať. Pre ostatných len toľko: ak výslovnosť nepotrebujete, neinštalujte ju. A ak ju potrebujete, tak vám snáď aspoň malou kompenzáciou bude fakt, že môžete so súbormi svojvoľne pracovať – napríklad si môžete nechať iba niektoré alebo si nahovoriť vlastné. Len pre predstavu: vyššie opísaným postupom vytvorený adresár má zatarovaný (čiže uložený v jednom súbore bez kompresie) necelých 190 MB.
Universal Dictionary je projekt, ktorého cieľom je vytvoriť slovník, ktorý by vzájomne prepájal hneď niekoľko jazykov naraz. Princíp fungovania slovníka možno najlepšie pochopiť zo stránok projektu. Rovnako ako pri GNU/FDL slovníku i tento rastie vďaka komunite dobrovoľných prekladateľov. Na internete sme objavili pythonový skript, ktorým možno bilinguálne preklady vygenerované na stránke www.dicts.info/uddl.php prekonvertovať do StarDictu a upravili sme ho tak, aby mu nerobili problémy riadky s 3 stĺpcami.
WT-slovník je freewarový anglicko-slovenský slovník s približne polovičnou slovnou zásobou GNU/FDL. Po konverzii z databázy MS Access na plaintext môžete použiť nasledovný skript a pomocou tabfile vytvoriť z vygenerovaného súboru slovníkové súbory pre StarDict. Súbory .ifo
si musíte „vyrobiť“ sami – stačí, ak sa inšpirujete už jestvujúcimi súbormi v /usr/share/stardict/dic. Hodnotu wordcount vypíše tabfile.
Slovníky Millennium sú k dispozícií na stiahnutie na stránkach fy Commercial Service, s.r.o. a to vo všetkých verziách. Základná verzia je free, ostatné sú funkčné po dobu 30 dní, pre dlhšiu dobu používania je potrebné kúpiť odblokovací kľúč.
Konverzia je možná, no postup trochu kontroverzný, a tak sme sa rozhodli nakoniec neuverejňovať návod. Asi by to nebolo úplne férové. Každopádne zverejňujeme skript pre tých, ktorý si nedajú pokoj a ochranu Access databázy (mdb) nejakým spôsobom obišli (funguje pre všetky jazykové verzie i úrovne slovníkov).
Jeden z autorov StarDictu tvrdí, že sa mu podarilo zistiť spôsob, akým sú ukladané heslá v databáze slovníkov Babylon. Na predídenie potenciálnym licenčným problémom sa však rozhodol ho nepublikovať. Mnoho ďalších free slovníkov pre platformu Windows možno nájsť napríklad na stránkach slunecnice.cz a tak môžete pokúšať šťastie s ich spúšťaním pod Wine. To už je ale téma na iný článok.
Na slunecnice.cz sme objavili tiež free slovník iTranslator, ktorý síce (zatiaľ) nefunguje pod Linuxom, no zaujímavý je predovšetkým slovnou zásobou (cca 400 000 slov). Databáza je uložená v sqlite3, takže jej spracovanie je prakticky triviálne. V plaintext formáte má potom uložené dáta tiež slovník Slovník 1.6 s necelými 150 000 záznamami.
Aj keď sa to už cudzojazyčných slovníkov príliš netýka, občas
sa môže hodiť aj slovník cudzích slov. Jeden taký, určený pre Palm (a
teda dosť skromný), je Slovník cizích slov. Pretože ide o obyčajný Palm dokument (.pdb
), je konverzia veľmi jednoduchá a zmestí sa doslova na jeden riadok:
txt2pdbdoc -d scs.pdb | grep " - " | sed "s/ - /\t/" | tr -d '"' | \
iconv -f cp1250 -t utf8 >out; tabfile out
Príslušný .ifo
súbor si musíte pripraviť sami.
Na záver porovnanie veľkosti slovnej zásoby pre popisované slovníky (hodnota wordcount – teda počet unikátnych hesiel) – výkladové slovníky a dvojjazyčné smer anglicko-český:
Názov slovníka | Odkaz | Wordcount | Cena (v Kč bez DPH) |
The Britannica Concise | www.britannica.com | 24 402 | free |
Collins Cobuild | collins.co.uk | 34 097 | free |
WordNet | wordnet.princeton.edu | 149 535 | free |
Oxford Advanced Learner's | oup.com/elt/oald | 34 153 | free |
Merriam Webster 10th | m-w.com | 20 517 | free |
Longman - Contemporary English | longman.com/ldoce | 43 052 | free |
GNU/FDL k 13. 6. 2006 | slovnik.zcu.cz | 84 209 | free |
PC Translator 2005 | translator.cz | 408 243 | 3 750 |
Universal Dictionary k 13. 6. 2006 | dicts.info | 16 674 | free |
WT-slovník (ang-sk) | slovnik.wtsba.sk | 46 674 | free |
Millennium Profi | pc-slovniky.cz | 945 772 | 12 800 |
Pozn. Mnoho ďalších anglických výkladových slovníkov pre StarDict možno stiahnuť zo stránky XDXF Dictionaries Download.
Screenshot bežiaceho programu (PNG, 85 kB)
Veríme, že informácie obsiahnuté v článku boli pre vás zaujímavé a užitočné a že argument o nedostatku kvalitných slovníkov pre Linux je pre väčšinu z vás už minulosťou. Ak máte tipy na ďalšie slovníky, prosím zmieňte sa o nich v diskusii.
Niektoré postupy pri konverzii predovšetkým komerčných slovníkov bohužiaľ vyžadujú použitie closed-source software (MS Windows, MS Access), prípadne sama oprávnenosť konverzie môže byť rozporuplná. Z tohto dôvodu sme sa rozhodli postupy nezverejňovať a nechať všetko na vôli a schopnostiach používateľa. Dúfame, že netreba nijak zvlášť prízvukovať, že slovníky vygenerované z komerčných databáz nie sú určené na publikovanie kdekoľvek na internete či inými prostriedkami.
Za nečistosť či neefektivitu skriptov sa ospravedlňujeme – ani jeden z nás nie je zameraním programátor, navyše sa domnievame, že prevod slovníka je jednorazový proces, a tak sa perličkovaním a šperkovaním do dokonalosti nechceme zaoberať.
Veľa úspechov pri objavovaní krás cudzích jazykov prajú autori článku,
PS: Radi by sme poďakovali Vítovi Pelčákovi aka Belisarivsovi za pomoc pri nezávislom testovaní skriptov.
Nástroje: Tisk bez diskuse
Tiskni
Sdílej:
mv $1-cz-dict.txt $1-cz-dictionary.txt mv cz-$1-dict.txt cz-$1-dictionary.txt rm en-cz-dictionary.txt cz-en-dictionary.txt echo "Vytvaram data pre StarDict slovnik ..." for slovnik in $1"-cz-dictionary.txt" "cz-"$1"-dictionary.txt"se mi zdalo tak jako zcestne, tak jsem zakomentoval tu radku s
rm
a uz se to v pohode vytvorilo. Ze by bug?
----
Vytvaram zoznam cudzojazycnych vyrazov...anglictina
Vytvaram zoznam ceskych vyrazov...
Vytvaram zoznam typov...
Vytvaram slovnikove udaje pre oba smery...
Traceback (most recent call last):
File "merge_dict.py", line 21, in ?
dictionary.write(en[:-1])
NameError: name 'en' is not defined
Vytvaram data pre StarDict slovnik ...
ls: en-cz-dictionary.txt.idx: není souborem ani adresářem
ls: cz-en-dictionary.txt.idx: není souborem ani adresářem
Skopirujte subory s priponou .ifo, .dict a .idx do /usr/share/stardict/dic/transl alebo ~/.stardict/dic/transl
rm: cannot remove `en-cz-dictionary.txt': není souborem ani adresářem
rm: cannot remove `cz-en-dictionary.txt': není souborem ani adresářem
----
Muzete mi prosim pomoci? Kde mam chybu? Dekuji, Honza.
Skusal som ten skript (pre translator) v systeme s kodovanim utf8a práve tu imo bude Váš problém.. (viď odpoveď vyššie)
zcat ANCSZAL.15 ANCSZAL.25 ANCSZAL.35 ANCSZAL.45 ANCSZAL.55 > ancs.txt
2) Přepnul jsem v konzoli kodování na ISO8859-2:
export LC_ALL=cs_CZ.ISO-8859-2
3) Ve skriptu conv.sh jsem zakomentoval pomocí # řádek 38:
#rm en-cz-dictionary.txt cz-en-dictionary.txt
4) Spustil jsem
./convert.sh en
5) Vznikly mně tyto soubory:
cz-en-dictionary.txt.dict.dz
cz-en-dictionary.txt.idx
cz-en-dictionary.txt.ifo
en-cz-dictionary.txt.dict.dz
en-cz-dictionary.txt.idx
en-cz-dictionary.txt.ifo
Ty jsem nakopíroval do /usr/share/dict/. Problém je, že v StarDictu nejsou slovíčka EN propojena s CZ a naopak... Zkrátka to hledá anglická slovíčka v anglickém seznamu slov bez toho, že by se zobrazoval překlad do CZ.
Poradíte někdo? Díky.
Ja bych jeste zkusil (docasne) odskrtnout vsechny slovniky krome jednoho testovaneho (je to v nastaveni slovniku) a pak bych zadaval slova.Jo, to jsem samozřejmě zkoušel. Ale jak píšu výše, zobrazí se jen hledané slovíčko, nikoliv jeho jinojazyčný protějšek...
export ZALOHA=$LANG export LC_ALL=cs_CZ.ISO-8859-2a na koniec
export LC_ALL=$ZALOHAnie som ziadny linux-guru, ale myslim, ze to pomoze vyriesit problem kodovania ISO8859-2 vs. 'hocico' a tiez presunut riadok pred vytvaranim stardict slovnika
rm en-cz-dictionary.txt cz-en-dictionary.txtna koniec skriptu, aby nebolo potrebne komentovat ho osobitne pre anglicky jazyk
1. vytvoril som ancs.txt z tych asi 5 suborov
2.mam syst. s utf8 a tak som kvoli iso8859-2 pouzil knoppix (asi 3.7) a spustil ten skript ./convert.sh en , nezakomentovaval som nic ale je lepsie asi zakomentovat riadky kde je rm foreign.txt czech.txt type.txt aby sa vytvorili a nezmazali (musel som stihnut skopirovat ich pred vymazanim ). vytvorili sa aj .ifo subory.(V knoppixe vypisalo chybu ze mu nieco chyba. Ale to je nepodstatne.)
3. potom som pouzil skript python merge_dict.py a z foreign.txt czech.txt type.txt sa vytvorili en-cz-dictionary.txt a cz-en-dictionary.txt
4.prikazom ./tabfile en-cz.dictionary.txt a ./tabfile cz-en...txt sa vytvorili .dz a .idx subory pre oba smery slovnika. Prikaz nesmie skoncit chybou. Ak skonci, treba odstranit nevhodne znaky z jednotlivych riadkov. Vacsinou mu vadi znak / . Prikaz vypise wordcount-y . (tabfile som pouzil originalny - po skompilovani stardictu)
5. .ifo subory vytvorene v kroku 2 som doplnil: wordcount-y su z bodu 4 a idxfilesize sa zisti prikazom ls -l en-cz-dictionary.idx (a aj pre cz-en-dictionary.idx)
6.treba nakopirovat .dz .idx. .ifo sub. napr. do /usr/share/stardict/example-dict
7.Na overenie ci je slovnik spravne vytvoreny treba pouzit prikaz ./stardict_verify /cestakslovniku/vytvoreny_subor.ifo stardict_verify sa nachadza v adresari /src/tools po skompilovani stardictu.
8.hotovo.ako zadefinujem wordcounty pre novovytvorne subory.riadok wordcount= v .ifo súbore
Inac je to ok ked wc anglickeho je iny ako wc slovenskeho?je to úplne OK. príklad slovníka: dog=pes;kamarát. wordcount pre anglicko-slovenský slovník: 1, opačne 2.
tr -d '"' <subor.txt | iconv -f iso8859-1 -t utf-8 >slovnik.txt; tabfile slovnik.txtpotom vytvorte .ifo súbor.
perl -pe 's/#(.*?) (.*?) *\[.....\] :: (.*)/\1\t< \ span size="smaller" color="darkseagreen">\2<\/span> \3/' DICTPAGE.RAW >\ latin-english.txt ./tabfile latin-english.txtpotom už len stačí v ifo súbore zmeniť sametypesequence z m na g a vytvoriť pre nový slovník adresár v ceste so slovníkmi StarDictu.
#!/bin/bash # give the downloaded file a zip extension and within the archive locate # the file containing the word database # preview it and according to its content uncomment one of the lines #perl -pe "s/^ (.*?) : (.*?) :/\1\t\2/" "$1" | cstocs il1 utf8 >jdict-"$1" #perl -pe "s/^ (.*?) \| (.*?) \|/\1\t\2/" "$1" | cstocs il1 utf8 >jdict-"$1" ./tabfile jdict-"$1"
tr -d '\r' < Interlingua_English | awk 'getline a {print $0"\t"a} getline b {}'
#!/bin/bash tr -d '\r' < "$1" | awk 'getline a {print $0"\t"a} getline b {}' \ | cstocs il1 utf8 | sed -e "s/<br>//gi" -e "s/<hr>//gi" \ | vi -c ":%s/<\([^>]*\)>/<\L\1>/g" -c ":w! jdict-$1" -c ":q" - ./tabfile jdict-"$1"
dbview -bt -d\; file.dbf | awk -F\; '{print $1 "\t" $3 " " $4}' | iconv -f ibm852 -t utf-8 >file.out