abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 05:11 | Komunita

    #HACKUJBRNO 2024, byly zveřejněny výsledky a výstupy hackathonu města Brna nad otevřenými městskými daty, který se konal 13. a 14. dubna 2024.

    Ladislav Hagara | Komentářů: 0
    včera 17:55 | IT novinky

    Společnost Volla Systeme stojící za telefony Volla spustila na Kickstarteru kampaň na podporu tabletu Volla Tablet s Volla OS nebo Ubuntu Touch.

    Ladislav Hagara | Komentářů: 3
    včera 17:44 | IT novinky

    Společnost Boston Dynamics oznámila, že humanoidní hydraulický robot HD Atlas šel do důchodu (YouTube). Nastupuje nová vylepšená elektrická varianta (YouTube).

    Ladislav Hagara | Komentářů: 0
    včera 15:11 | Nová verze

    Desktopové prostředí LXQt (Lightweight Qt Desktop Environment, Wikipedie) vzniklé sloučením projektů Razor-qt a LXDE bylo vydáno ve verzi 2.0.0. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 14:22 | IT novinky

    Nejvyšší soud podpořil novináře Českého rozhlasu. Nařídil otevřít spor o uchovávání údajů o komunikaci (data retention). Uvedl, že stát odpovídá za porušení práva EU, pokud neprovede řádnou transpozici příslušné směrnice do vnitrostátního práva.

    Ladislav Hagara | Komentářů: 0
    včera 05:33 | Zajímavý článek

    Minulý týden proběhl u CZ.NIC veřejný test aukcí domén. Včera bylo publikováno vyhodnocení a hlavní výstupy tohoto testu.

    Ladislav Hagara | Komentářů: 22
    včera 04:44 | Nová verze

    Byla vydána nová verze 3.5.0 svobodné implementace protokolu RDP (Remote Desktop Protocol) a RDP klienta FreeRDP. Přehled novinek v ChangeLogu. Opraveno bylo 6 bezpečnostních chyb (CVE-2024-32039, CVE-2024-32040, CVE-2024-32041, CVE-2024-32458, CVE-2024-32459 a CVE-2024-32460).

    Ladislav Hagara | Komentářů: 0
    včera 04:11 | Nová verze

    Google Chrome 124 byl prohlášen za stabilní. Nejnovější stabilní verze 124.0.6367.60 přináší řadu oprav a vylepšení (YouTube). Podrobný přehled v poznámkách k vydání. Opraveno bylo 22 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    včera 02:22 | Nová verze

    Byla vydána nová verze 9.3 z Debianu vycházející linuxové distribuce DietPi pro (nejenom) jednodeskové počítače. Přehled novinek v poznámkách k vydání. Novinkou je vlastní repozitář DietPi APT.

    Ladislav Hagara | Komentářů: 0
    16.4. 18:44 | Nová verze

    Byl vydán Mozilla Firefox 125.0.1, první verze z nové řady 125. Přehled novinek v poznámkách k vydání, poznámkách k vydání pro firmy a na stránce věnované vývojářům. Vypíchnout lze podporu kodeku AV1 v Encrypted Media Extensions (EME). Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 125.0.1 je již k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    KDE Plasma 6
     (66%)
     (11%)
     (2%)
     (21%)
    Celkem 509 hlasů
     Komentářů: 4, poslední 6.4. 15:51
    Rozcestník

    (Nielen) anglicko-české slovníkové databázy pre StarDict

    23. 6. 2006 | Pavel Stříž, Jozef Říha | Tipy a triky | 30240×

    Tento článok preto predstavuje postupy, akými možno naplniť open source slovník StarDict niektorými komerčnými či free slovníkovými databázami. Pokiaľ namiesto StarDictu používate iný slovník, ktorý možno rozšíriť o ďalšie databázy, i tak vám môžu vám byť niektoré informácie na úžitok.

    Pred necelým rokom magazín LinuxEXPRES publikoval článok s názvom Svobodné slovníky pro Linux, kde predstavil čitateľom viaceré slovníkové aplikácie. Častokrát dôležitejšie než pohodlnosť a efektívnosť práce s takouto aplikáciou sú však dáta, ktoré má k dispozícii. Nazdávame sa, že nezanedbateľné percento používateľov si nie je dostatočne vedomé možností a zdrojov, odkiaľ ich získať.

    StarDict

    StarDict je jednoduchý, no svojimi funkciami plne postačujúci slovník pre platformu Linux, Windows, FreeBSD i Solaris. Zvláda vyhľadávanie vo viacerých databázach naraz, prehľadáva schránku, pre rýchlejšie vyhľadávanie používa indexáciu, rozoznáva zástupné znaky a po dodaní zvukových súborov hľadané slovo tiež prehrá na zvukovom výstupe. Existuje tiež konzolová aplikácia (sdcv), ktorá používa databázu vo formáte StarDict. Čo vám na StarDicte môže prekážať, je to, že okrem samotného dopytu nespracúva žiadne iné argumenty (použité databázy, výstup do konzoly a pod.) a tiež nemožnosť zmeny niektorých "hard-coded" nastavení (cesta pre súbory s výslovnosťou, klávesové skratky).

    Samotný slovník neobsahuje po inštalácii žiadne databázy. Na stránkach projektu sa ako prvé ponúkajú free výkladové anglické slovníky (WordNet, Collins Cobuild, LongMan), ktoré ste si už pravdepodobne doinštalovali. Nie každý je však natoľko zdatný v angličtine, aby mu výkladový slovník stačil, a preto sa pozrieme na česko-anglické databázy.

    GNU/FDL AČ-ČA

    Projekt GNU/FDL Anglicko-český slovník od pána Milana Svobody je dostatočne známy a netreba ho nijak zvlášť predstavovať. Ide o slovník pre voľné použitie, do ktorého môže, prostredníctvom webového rozhrania, prispievať každý (bez nutnosti registrácie). To má samozrejme svoje výhody (neologizmy, možnosť rýchlej opravy chýb a nepresností) i tienisté stránky (možné licenčné problémy či chyby v preklade). Vďaka pánovi Čihařovi a jeho blogovému zápisu možno sťahovať každý deň aktualizovanú verziu GNU/FDL slovníka vo formáte StarDict na tejto adrese. Neostáva nič iné, len poďakovať.

    PC Translator

    PC Translator od firmy LangSoft je pomerne obľúbený prekladač a to nielen v Čechách, ale i na Slovensku. Slovník je možné spustiť i pod Wine, no najnovšie verzie majú bohužiaľ problémy so zobrazovaním, čo používanie slovníka značne obmedzuje (po dvojkliknutí na výsledok vyhľadávanie sa zobrazí iba prvá možnosť). Napadlo nás, či by bolo možné skonvertovať použitú jazykovú databázu pre StarDict.

    Slovníkové údaje sú uložené vo formáte DBF v3; najjednoduchšia cesta, ako z nich vydolovať dáta, je však použiť iný spôsob než parsovanie týchto dát. Spustite Dictionary manager (wtrdctm.exe vo Windows alebo príkazom wine wtrdctm.exe) a vyberte možnosť Zálohovanie slovníku. V inštalačnom adresári pribudne niekoľko súborov s príponami .15, .25, ..., .55. Súbory dekomprimujte a zlúčte do jednoho príkazom

    zcat prvy.15, druhy.25 .. >ancs.txt

    Pre ďalšie spracovanie tohto súboru sme pripravili skript, ktorý si môžete stiahnuť na tomto mieste. Okrem perlu budete potrebovať ešte binárku tabfile (src/tools tarballu stardict). Taktiež sa uistite, či máte v systéme prítomnú utilitu dictzip (balík dictd), ktorá kompresiou môže zmenšiť slovníkový súbor až o polovicu.

    Rozbalený skript a súbor ancs.txt umiestnite do spoločného adresára a spustite ho spolu s dvojpísmenovým kódom jazyka ako argument. Výsledkom spustenia sú 3 súbory – ifo/diz/idx. Vytvorte pre ne adresár (názov nie je dôležitý) a skopírujte ho buď do systémového /usr/share/stardict alebo ~/.stardict/dic. V tejto chvíli by ste mali po reštartovaní StarDictu vidieť novú slovnú zásobu.

    Podobným spôsobom je možné pre StarDict skonvertovať i slovník fráz. V PC Translatore sa tento zobrazí po kliknutí na nájdené slovo pravým tlačidlom myši alebo stlačení Ctrl+M. Na tento účel vám poslúži tento skript.

    Momentálne možno skriptami preložiť anglickú, slovenskú, poľskú, latinskú, taliansku, francúzsku, portugalskú, španielsku, holandskú, maďarskú, ruskú a švédsku slovnú zásobu.

    Pri PC Translatore stojí ešte za zmienku terminálový program českého autora s názvom dP translator, ktorý by mal podporovať slovníkové dáta PC Translatoru priamo, bez nutnosti ich konverzie. Bohužiaľ kód je už natoľko zastaralý (posledná úprava roku 1999), že sa nám ho nepodarilo úspešne skompilovať.

    Audio?

    Pomocou skriptu vyslovnost.py si môžete vygenerovať zo súborov *.cmp v inštalačnom adresári Translatora audiosúbory s výslovnosťou. Postup je nasledujúci: v adresári s inštalačnými súbormi spustite príkaz

    dbf --csv reader.out readera.dbf

    v skripte vyslovnost.py upravte cestu, kam sa majú audiosúbory ukladať, a spustite python vyslovnost.py. Hotový adresár so súbormi presuňte do /usr/share.

    PC Translator používa výslovnosť vo formáte Ogg komprimovaný speex kodekom. Kvalita nahrávok sa nám nepríliš pozdáva, prekážala nám predovšetkým veľmi slabá intonácia. Odporúčame preto stiahnutie WyabdcRealPeopleTTS – voľne dostupného balíku s wav súbormi, ktoré sa počúvajú oveľa lepšie, a ich vzájomné skombinovanie: teda na miesto s uloženými súbormi skopírujte a potvrďte prepísanie súborov s rovnakým názvom. Posledná úprava, ktorú treba vykonať, je nastavenie skriptu pre prehrávanie súborov. Buď v nastavení StarDictu zadáte program, ktorý zvláda prehranie .wav i .ogg súborov (MPlayer si bohužiaľ s wav súbormi o tak nízkom bitrate neporadí), alebo použite tento bashový skript.

    Tým používateľom, ktorí majú disk formátovaný malými blokmi či súborový systém optimalizovaný pre malé súbory, takmer 50 000 súborov na disku nebude prekážať. Pre ostatných len toľko: ak výslovnosť nepotrebujete, neinštalujte ju. A ak ju potrebujete, tak vám snáď aspoň malou kompenzáciou bude fakt, že môžete so súbormi svojvoľne pracovať – napríklad si môžete nechať iba niektoré alebo si nahovoriť vlastné. Len pre predstavu: vyššie opísaným postupom vytvorený adresár má zatarovaný (čiže uložený v jednom súbore bez kompresie) necelých 190 MB.

    Universal Dictionary

    Universal Dictionary je projekt, ktorého cieľom je vytvoriť slovník, ktorý by vzájomne prepájal hneď niekoľko jazykov naraz. Princíp fungovania slovníka možno najlepšie pochopiť zo stránok projektu. Rovnako ako pri GNU/FDL slovníku i tento rastie vďaka komunite dobrovoľných prekladateľov. Na internete sme objavili pythonový skript, ktorým možno bilinguálne preklady vygenerované na stránke www.dicts.info/uddl.php prekonvertovať do StarDictu a upravili sme ho tak, aby mu nerobili problémy riadky s 3 stĺpcami.

    WT-slovník

    WT-slovník je freewarový anglicko-slovenský slovník s približne polovičnou slovnou zásobou GNU/FDL. Po konverzii z databázy MS Access na plaintext môžete použiť nasledovný skript a pomocou tabfile vytvoriť z vygenerovaného súboru slovníkové súbory pre StarDict. Súbory .ifo si musíte „vyrobiť“ sami – stačí, ak sa inšpirujete už jestvujúcimi súbormi v /usr/share/stardict/dic. Hodnotu wordcount vypíše tabfile.

    Millennium

    Slovníky Millennium sú k dispozícií na stiahnutie na stránkach fy Commercial Service, s.r.o. a to vo všetkých verziách. Základná verzia je free, ostatné sú funkčné po dobu 30 dní, pre dlhšiu dobu používania je potrebné kúpiť odblokovací kľúč.

    Konverzia je možná, no postup trochu kontroverzný, a tak sme sa rozhodli nakoniec neuverejňovať návod. Asi by to nebolo úplne férové. Každopádne zverejňujeme skript pre tých, ktorý si nedajú pokoj a ochranu Access databázy (mdb) nejakým spôsobom obišli (funguje pre všetky jazykové verzie i úrovne slovníkov).

    Ďalšie slovníky?

    Jeden z autorov StarDictu tvrdí, že sa mu podarilo zistiť spôsob, akým sú ukladané heslá v databáze slovníkov Babylon. Na predídenie potenciálnym licenčným problémom sa však rozhodol ho nepublikovať. Mnoho ďalších free slovníkov pre platformu Windows možno nájsť napríklad na stránkach slunecnice.cz a tak môžete pokúšať šťastie s ich spúšťaním pod Wine. To už je ale téma na iný článok.

    Na slunecnice.cz sme objavili tiež free slovník iTranslator, ktorý síce (zatiaľ) nefunguje pod Linuxom, no zaujímavý je predovšetkým slovnou zásobou (cca 400 000 slov). Databáza je uložená v sqlite3, takže jej spracovanie je prakticky triviálne. V plaintext formáte má potom uložené dáta tiež slovník Slovník 1.6 s necelými 150 000 záznamami.

    Aj keď sa to už cudzojazyčných slovníkov príliš netýka, občas sa môže hodiť aj slovník cudzích slov. Jeden taký, určený pre Palm (a teda dosť skromný), je Slovník cizích slov. Pretože ide o obyčajný Palm dokument (.pdb), je konverzia veľmi jednoduchá a zmestí sa doslova na jeden riadok:

    txt2pdbdoc -d scs.pdb | grep " - " | sed "s/ - /\t/" | tr -d '"' | \
    iconv -f cp1250 -t utf8 >out; tabfile out

    Príslušný .ifo súbor si musíte pripraviť sami.

    Suma sumárum

    Na záver porovnanie veľkosti slovnej zásoby pre popisované slovníky (hodnota wordcount – teda počet unikátnych hesiel) – výkladové slovníky a dvojjazyčné smer anglicko-český:

    Názov slovníka Odkaz Wordcount Cena (v Kč bez DPH)
    The Britannica Concise www.britannica.com 24 402 free
    Collins Cobuild collins.co.uk 34 097 free
    WordNet wordnet.princeton.edu 149 535 free
    Oxford Advanced Learner's oup.com/elt/oald 34 153 free
    Merriam Webster 10th m-w.com 20 517 free
    Longman - Contemporary English longman.com/ldoce 43 052 free
    GNU/FDL k 13. 6. 2006 slovnik.zcu.cz 84 209 free
    PC Translator 2005 translator.cz 408 243 3 750
    Universal Dictionary k 13. 6. 2006 dicts.info 16 674 free
    WT-slovník (ang-sk) slovnik.wtsba.sk 46 674 free
    Millennium Profi pc-slovniky.cz 945 772 12 800

    Pozn. Mnoho ďalších anglických výkladových slovníkov pre StarDict možno stiahnuť zo stránky XDXF Dictionaries Download.

    Dôkaz miesto sľubov

    slovniky stardict

    Screenshot bežiaceho programu (PNG, 85 kB)

    Na záver

    Veríme, že informácie obsiahnuté v článku boli pre vás zaujímavé a užitočné a že argument o nedostatku kvalitných slovníkov pre Linux je pre väčšinu z vás už minulosťou. Ak máte tipy na ďalšie slovníky, prosím zmieňte sa o nich v diskusii.

    Niektoré postupy pri konverzii predovšetkým komerčných slovníkov bohužiaľ vyžadujú použitie closed-source software (MS Windows, MS Access), prípadne sama oprávnenosť konverzie môže byť rozporuplná. Z tohto dôvodu sme sa rozhodli postupy nezverejňovať a nechať všetko na vôli a schopnostiach používateľa. Dúfame, že netreba nijak zvlášť prízvukovať, že slovníky vygenerované z komerčných databáz nie sú určené na publikovanie kdekoľvek na internete či inými prostriedkami.

    Za nečistosť či neefektivitu skriptov sa ospravedlňujeme – ani jeden z nás nie je zameraním programátor, navyše sa domnievame, že prevod slovníka je jednorazový proces, a tak sa perličkovaním a šperkovaním do dokonalosti nechceme zaoberať.

    Veľa úspechov pri objavovaní krás cudzích jazykov prajú autori článku,

    Jozef Říha, Pavel Stříž

    PS: Radi by sme poďakovali Vítovi Pelčákovi aka Belisarivsovi za pomoc pri nezávislom testovaní skriptov.

           

    Hodnocení: 100 %

            špatnédobré        

    Nástroje: Tisk bez diskuse

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    23.6.2006 00:39 Thunder.m | skóre: 35 | blog: e17
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Dobrý, tohle jsem chtěl začít brzy hledat :) Ale koukám že jsem už asi našel, Stardict se mi zdá celkem super, ještě dohledat nějaké ty slovníky i pro španělštinu a je to :)
    belisarivs avatar 23.6.2006 06:30 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Mohl bys zkusit (pokud mas PC translator) zalohovat spanelstinu a pouzit prislusny skript. Myslim, ze spanelstina je podporovana.
    IRC is just multiplayer notepad.
    jose17 avatar 23.6.2006 22:52 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    ne, španělská abeceda zatím podporována není. ale třeba se najde nějaký dobrovolník, je to docela triviální (stačí hexeditor a tužka+papír :-))
    Ja vim, on vi, ty nano!
    belisarivs avatar 23.6.2006 06:31 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Tak vidim, ze ti to vlozili. No vidis. A ty jsi se divil, kde to vazne.
    IRC is just multiplayer notepad.
    23.6.2006 08:51 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Nechápu, proč když už jsou zmíněné komerční slovníky, kór only win, proč autor nezmínil také Lingea Lexicon, který má rovněž nativní linuxovou verzi, a co do rozsahu slov řadu zmíněných jistě překonává.
    23.6.2006 09:00 Michal Karas | skóre: 45 | blog: /dev/random
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Lexicon byl fajn, bohužel dnes už mi GTK+1 a OSS moc nevyhovují. Nezkoušel někdo dostat ta data do StarDictu?
    1.7.2006 12:31 Klokan Petr Přidal | skóre: 1
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    No, mam tu skript, ktery data z Lingei dostane, chtelo by na nem jeste tak pulden pracovat... aby to bylo 100% ale vse je pripravene, napsane v pythonu.. Pokud ma nekdo zajem ozvete se.
    belisarivs avatar 6.7.2006 11:43 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Nazdar. Psali jsme ti s Josem na mail.
    IRC is just multiplayer notepad.
    9.7.2006 18:59 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    25.10.2007 14:37 Klokan Petr Přidal | skóre: 1
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Tak jsem ten skript konecne pustil ven, pokud vas to zajima tady je: Lingea .trd decoder for Stardict tabfile
    23.6.2006 08:55 GeBu | skóre: 27 | blog: zápisky
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Nevíte někdo o nějakých dobrých databázích pro Ruštinu a Ukrajinštinu? Pro překlad do češtiny a zpět.
    23.6.2006 09:02 Michal Karas | skóre: 45 | blog: /dev/random
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Díky za pěkný článek.

    Taky si trochu přihřeju polívčičku. :-) Před pár dny jsem přidal do AURu PKGBUILDy pro LongMana a GNU/FDL Anglicko-Český slovník, takže uživatelé Arch Linuxu je mohou využít.
    Daniel Kvasnička ml. avatar 23.6.2006 09:56 Daniel Kvasnička ml. | skóre: 52 | blog: The Joys and Sorrows of Being an IT Freak | Ostrava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Takovy clanek tu chybel, ale ze autor da Lingea Lexicon, nejpropracovanejsi slovnik na trhju s Linuxovou verzi, jen do odkazu, to je zasadni chyba...

    Ta soucasna GTK1 verze je priserna, co se tyka programu, ale psal jsem do Lingey co chystaji a bylo mi receno, ze novou multiplatformni verzi a ze GTK to nebude, tak cekam :-)
    FSF: “screw you for not wanting the stuff we produce”, People: “screw you for not producing the stuff we want."
    stativ avatar 24.6.2006 09:37 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Sazim na javu.
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    24.6.2006 14:30 bhy | skóre: 35 | blog: bhyblog | brno
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Proc ne Mono?
    1.7.2006 12:32 Klokan Petr Přidal | skóre: 1
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Pod Macem maji verzi napsanou v Jave (a jede to pomalu), pocitam, ze zustanou u Javy :-(.
    23.6.2006 09:57 Christof | skóre: 22 | Havířov
    Rozbalit Rozbalit vše české výkladové slovníky
    udělám malou reklamu na projekt DEBDict - prohlížeč různých slovníků (v současné době např. slovník spisovné češtiny, slovník synonym, slovníky cizích slov, encyklopedie Diderot...). Bohužel kvůli autorským právům nejsou data úplně volně přístupná.
    Daniel Kvasnička ml. avatar 23.6.2006 10:00 Daniel Kvasnička ml. | skóre: 52 | blog: The Joys and Sorrows of Being an IT Freak | Ostrava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    No a multiplatformni vicejazycny PEKI slovnik taky zminen nebyl ...i kdyz jeho databaze nijak slavna neni, jazyku umi opravdu dost.
    FSF: “screw you for not wanting the stuff we produce”, People: “screw you for not producing the stuff we want."
    belisarivs avatar 23.6.2006 10:21 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    No, Peki ale IMHO vyuziva GNU-FDL databaze, ne?

    Vy jste to nepochopil (a nejen vy). On nechtel primarne zminovat ruzne slovniky ale jenom databaze, ktere by sly dostat do Stardictu.

    O to slo.
    IRC is just multiplayer notepad.
    23.6.2006 18:31 miguel2
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Pre autora clanku:v akom formate musia byt data aby sa dal pouzit skript pre millennium. Je niekde skript na konverziu dat do stardict-u v tvare: eng_slovo TAB cz_slovo LF . Ide o databazu slov pre PEKI slovnik a chcel by som to pouzit v stardict-e. Neviem programovat a tak mi ten skript robi problemy. Dik za pomoc
    belisarivs avatar 23.6.2006 20:06 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Nepouziva PEKI GNU-FDL databazi? V tom pripade tu Michal Cihar pravidelne updatuje tuto databazi pro Stardict.
    IRC is just multiplayer notepad.
    23.6.2006 20:51 miguel2
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    pouzivam vlastnu databazu ,teraz ju mam upravenu do Peki slovnika, ale chcem tuto databazu nejako dostat do stardict-u.
    belisarivs avatar 28.6.2006 08:21 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    No, pro tabfile je formatovani soubou nasledujici

    Jazyk1/tab/jazyk2

    .

    .

    V jazyk1 i 2 mohou byt mezery. Je to pak chapano jako jeden vyraz. Takze bud si napisete skript sam, nebo si tu databazi upravite pro tabfile rucne.
    IRC is just multiplayer notepad.
    jose17 avatar 23.6.2006 23:00 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    na Vašu prvú otázku by vedel odpovedať skôr belisarvius, ale pohľad na skript trošku napovie (jedná sa o 3 súbory). čo sa týka otázky druhej, tak presne takémuto formátu (def1<tab>def2) rozumie tabfile (súčasť stardictu – adresár tools alebo prípadne použite nami predkompilovanú verziu)
    Ja vim, on vi, ty nano!
    24.6.2006 01:51 miguel2
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Vdaka za pomoc uz to ide
    31.1.2008 10:46 flim
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Odkud muzu stahnout Vami predkompilovanou verzi tabfile?
    jose17 avatar 31.1.2008 10:49 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    ozvite sa mi na e-mail a binarku Vam obratom zaslem.
    Ja vim, on vi, ty nano!
    24.6.2006 05:17 LukeT
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Zdravim,vim, je to trochu otravna zadost, ale prece...nenasel by se nekdo, kdo by mi poslal vycucnute a skriptem prejete data z PcTranslatoru s anglictinou? Mam tento program, jsem novacek v linuxu (mam Ubuntu 6.06) a netroufam si zatim na upravy zminene v clanku, lec k rychlejsimu a lepsimu prechodu na linux by mi moc ty data pomohly (pouzivam PcTransl k praci s Winama a je to jedina vec, ktera me u nich drzi, mrcha) ...muj email je linuxfan(ZAVINAC)seznam.cz
    belisarivs avatar 26.6.2006 12:35 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Ono neni zrovna legalni posilat si takova data. Pokud jsi opravnenym majitelem slovniku, tak neni problem udelat sito sam, ale porad se o to nemuzes s nikym delit.

    Dyt je to trivialni.

    Spust (ve Win) exac, ktery nabizi zalohovani databaze slovniku (nevim jmeno, ale neni to ten co preklada ani ten co ukazuje slovicka). V nem dej "Zalohovat databazi" (nebo tak nejak se to jmenuje), pak si vyber slovnik (nejspis anglictina), nabehne ukazatel. Az bude v pulce prubehu, zkopiruj si novy soubor ancs.txt nekam pryc (anebo podle navody, vezmi ty nove vytvorene soubory s ciselnyma priponama). Tam, kde mas nakopirovany ancs.txt rozbal ten skript co tu je, otevri si rozbaleny soubor convert.sh, smaz sharp (#) na zacatku radku 6 a 22 a spust ten soubor (skript).

    Pockas az to projede a podoplnujes data ktera ti to vyplivne. Kdyby neco muj jabber JID je "belisarivs at njs dot netlab dot cz".
    IRC is just multiplayer notepad.
    24.6.2006 17:08 pepe1 | skóre: 13 | blog: abcde
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Nedari se mi z meho oblibeneho Pc translatoru vytvorit soubory pro pouziti ve StarDict. Ze zkomprimovanych souboru vytvorim ancs.txt asi 9mb velky, ale kdyz pouziji skript podle navodu, tak se vytvori pouze dva soubory cz-en-dictionary.txt.ifo a en-cz-dictionary.txt.ifo. Bohuzel diz a idx soubor se nevytvori. Skript spoustim: convert.sh en. Treba to dela kodovani nevite jak skript uzpusobit na ISO8859-2. Podarilo se to nekomu prekonvertorovat?
    jose17 avatar 24.6.2006 20:51 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    jste si jistý, že používáte systémové kódování ISO8859-2 a ne UTF-8 (jak se píše v článku)?
    Ja vim, on vi, ty nano!
    25.6.2006 12:09 Glin | skóre: 2
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Taky mi to vytvarelo jen soubory ifo, tak jsem kouknul do skriptu a tohle (radky 36-41):
    mv $1-cz-dict.txt $1-cz-dictionary.txt
    mv cz-$1-dict.txt cz-$1-dictionary.txt
    rm en-cz-dictionary.txt cz-en-dictionary.txt
    echo "Vytvaram data pre StarDict slovnik ..."
    for slovnik in $1"-cz-dictionary.txt" "cz-"$1"-dictionary.txt" 
    se mi zdalo tak jako zcestne, tak jsem zakomentoval tu radku s rm a uz se to v pohode vytvorilo. Ze by bug?
    24.6.2006 18:08 Hobil | skóre: 1 | blog: Hobilovo_doupe
    Rozbalit Rozbalit vše Chyby ve scriptu?
    Prosim o help. Pripravil jsem si slovniky z Translatoru podle popisu ve clanku, spustil script convert.sh a vypadl mi tento vypis:

    ----

    Vytvaram zoznam cudzojazycnych vyrazov...anglictina

    Vytvaram zoznam ceskych vyrazov...

    Vytvaram zoznam typov...

    Vytvaram slovnikove udaje pre oba smery...

    Traceback (most recent call last):

    File "merge_dict.py", line 21, in ?

    dictionary.write(en[:-1])

    NameError: name 'en' is not defined

    Vytvaram data pre StarDict slovnik ...

    ls: en-cz-dictionary.txt.idx: není souborem ani adresářem

    ls: cz-en-dictionary.txt.idx: není souborem ani adresářem

    Skopirujte subory s priponou .ifo, .dict a .idx do /usr/share/stardict/dic/transl alebo ~/.stardict/dic/transl

    rm: cannot remove `en-cz-dictionary.txt': není souborem ani adresářem

    rm: cannot remove `cz-en-dictionary.txt': není souborem ani adresářem

    ----

    Muzete mi prosim pomoci? Kde mam chybu? Dekuji, Honza.

    Aktualni top neni 0.9, anobrz 3.2.8. Top 0.9 je beznadejne zastaraly.
    24.6.2006 19:37 miguel2
    Rozbalit Rozbalit vše Re: Chyby ve scriptu?
    mam podobny problem , ale bez chyby (line 21...) , a vytvoria sa iba .ifo subory. Skusal som ten skript (pre translator) v systeme s kodovanim utf8 , ale data (ancs.txt) boli v iso8859-2. Cely skript neprebehol , ale stihol som skopirovat subor czech.txt este pred tym nez sa vymazal a konverzia sa podarila az na znak hned za vyrazom . Ale neviem kde je chyba lebo skonci to ako v prispevku vyssie: ls: en-cz-dictionary.txt.idx: není souborem ani adresářem ls: cz-en-dictionary.txt.idx: není souborem ani adresářem ...
    jose17 avatar 24.6.2006 20:53 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: Chyby ve scriptu?
    Skusal som ten skript (pre translator) v systeme s kodovanim utf8
    a práve tu imo bude Váš problém.. (viď odpoveď vyššie)
    Ja vim, on vi, ty nano!
    belisarivs avatar 26.6.2006 12:40 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: Chyby ve scriptu?
    Jo. Problem je v UTF. Prepni se na iso8859-2 (aspon docasne). Taky je dobre se mrknout na ten skript. Musi se odkomentovat 6. radek (tusim, je to prikaz sed) a radek pro prislusny jazyk. Pak je to v pohode.
    IRC is just multiplayer notepad.
    27.6.2006 22:10 hank | skóre: 19
    Rozbalit Rozbalit vše Nefunguje
    Nachystal jsem si do adresáře tabfile, convert.sh, merge_dict.py a zálohované slovníky. Postupoval jsem takto:

    1) Vyvořil jsem soubor ancs.txt:

    zcat ANCSZAL.15 ANCSZAL.25 ANCSZAL.35 ANCSZAL.45 ANCSZAL.55 > ancs.txt

    2) Přepnul jsem v konzoli kodování na ISO8859-2:

    export LC_ALL=cs_CZ.ISO-8859-2

    3) Ve skriptu conv.sh jsem zakomentoval pomocí # řádek 38:

    #rm en-cz-dictionary.txt cz-en-dictionary.txt

    4) Spustil jsem

    ./convert.sh en

    5) Vznikly mně tyto soubory:
    cz-en-dictionary.txt.dict.dz
    cz-en-dictionary.txt.idx
    cz-en-dictionary.txt.ifo
    en-cz-dictionary.txt.dict.dz
    en-cz-dictionary.txt.idx
    en-cz-dictionary.txt.ifo
    
    
    Ty jsem nakopíroval do /usr/share/dict/. Problém je, že v StarDictu nejsou slovíčka EN propojena s CZ a naopak... Zkrátka to hledá anglická slovíčka v anglickém seznamu slov bez toho, že by se zobrazoval překlad do CZ.

    Poradíte někdo? Díky.
    jose17 avatar 28.6.2006 01:06 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: Nefunguje
    zadáte třeba slovíčko dog, co se zobrazí? vůbec nic? nepíše něco program v konzoli? vyhledává opačně, teda směr česko-anglický? /jose
    Ja vim, on vi, ty nano!
    28.6.2006 05:21 hank | skóre: 19
    Rozbalit Rozbalit vše Re: Nefunguje
    Zadám dog a najde dog, ale nezobrazí překlad.

    Když se podívám přímo do souboru cz-en-disctionary.txt.dict.dz, tak jsou v něm jen anglická slovíčka. V en-cz-disctionary.txt.dict.dz jsou zase jen česká slovíčka. Je to tak správně? Nemělo být vše v jednom souboru?

    Program funguje OK (v konzoli nic nevypisuje), ale nezobrazuje přeložená slovíčka.
    belisarivs avatar 28.6.2006 08:17 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: Nefunguje
    Ja bych jeste zkusil (docasne) odskrtnout vsechny slovniky krome jednoho testovaneho (je to v nastaveni slovniku) a pak bych zadaval slova.

    Ale mam pocit, ze v tom dz souboru maji byt slovajeom jednoho jazyka a k nim, se pridruzuji indexy podle kterych se teprve vybira preklad.

    Spis bych se mrknul na ty soubory ktere lezou do tabfile. Tam by se melo jednat o kombinace slov anglickych a ceskych.
    IRC is just multiplayer notepad.
    28.6.2006 08:40 hank | skóre: 19
    Rozbalit Rozbalit vše Re: Nefunguje
    Ja bych jeste zkusil (docasne) odskrtnout vsechny slovniky krome jednoho testovaneho (je to v nastaveni slovniku) a pak bych zadaval slova.
    Jo, to jsem samozřejmě zkoušel. Ale jak píšu výše, zobrazí se jen hledané slovíčko, nikoliv jeho jinojazyčný protějšek...
    jose17 avatar 28.6.2006 09:08 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: Nefunguje
    jak radí belisarvius - podivejte se na soubory, které zpracovava tabfile (zakomentujte posledni radek - s prikazem rm - v souboru convert.sh). klidne se mi ozvete na icq: 92597537 nebo jose1711@jabber.cz
    Ja vim, on vi, ty nano!
    28.6.2006 17:31 cirko
    Rozbalit Rozbalit vše Re: Nefunguje
    Mozno ste si to uz ujasnili cez ICQ/jabber, ale tiez by som rad vedel ako na to. Mam uplne rovnaky problem ako hank a cz-en-dictionary.txt obsahuje slovensky aj anglicky vyraz (podobne aj en-cz-...). Ine slovniky v stardicte (wordnet,...) mi bezia v pohode. Je mozne, ze je problem v tabfile?
    belisarivs avatar 28.6.2006 17:35 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: Nefunguje
    No, myslim, ze to tak ma byt. Ted nevim jak je to presne, ale pokud tyto soubory zpracovava tabfile, tak az z nej lezou vysledky. Ale format textu pro tabfile je tak jak jsem tu jiz zminoval. Cili tak jak pisete.
    IRC is just multiplayer notepad.
    29.6.2006 11:52 cirko
    Rozbalit Rozbalit vše Re: Nefunguje
    Nakoniec sa mi to poadrilo! Problem bol:

    a) vo verzii stardictu (2.4.2), ktora zrejme nepodporuje vystup z tabfile (ten sa objavuje v source az od verzie 2.4.6)

    -- potom to uz slapalo az na

    b) posunutu slovnu zasobu (o 1 slovo). Problem bol zrejme v nekorektne pridanom slove do PC translatora este vo Windowse - na to stacilo vymazat riadok s tym slovom v czech.txt (nastastie bolo hned na zaciatku a dalo sa lahko odhalit porovnanim czech.txt. a foreign.txt)

    btw. na vylepsienie skriptu by som navrhoval pridat na zaciatok
    export ZALOHA=$LANG
    export LC_ALL=cs_CZ.ISO-8859-2
    a na koniec
    export LC_ALL=$ZALOHA
    nie som ziadny linux-guru, ale myslim, ze to pomoze vyriesit problem kodovania ISO8859-2 vs. 'hocico'

    a tiez presunut riadok pred vytvaranim stardict slovnika
    rm en-cz-dictionary.txt cz-en-dictionary.txt
    na koniec skriptu, aby nebolo potrebne komentovat ho osobitne pre anglicky jazyk
    jose17 avatar 29.6.2006 12:36 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: Nefunguje
    díky. zmeny som aplikoval. ak sa Ti chce, môžeš sa mrknúť na novú verziu skriptu a prípadne dať vedieť, či Ti funguje. ešte raz dík. j
    Ja vim, on vi, ty nano!
    29.6.2006 14:25 cirko
    Rozbalit Rozbalit vše Re: Nefunguje
    No problem je v tom, ze ked si otvorim novu konzolu LC_ALL nema ziadnu hodnotu (vid echo $LC_ALL), preto ten LANG. Mozno u teba to funguje inak...
    28.6.2006 19:35 miguel2
    Rozbalit Rozbalit vše Re: Nefunguje
    ak ti to pomoze tak som isiel nato komplikovanejsie

    1. vytvoril som ancs.txt z tych asi 5 suborov

    2.mam syst. s utf8 a tak som kvoli iso8859-2 pouzil knoppix (asi 3.7) a spustil ten skript ./convert.sh en , nezakomentovaval som nic ale je lepsie asi zakomentovat riadky kde je rm foreign.txt czech.txt type.txt aby sa vytvorili a nezmazali (musel som stihnut skopirovat ich pred vymazanim :-)). vytvorili sa aj .ifo subory.(V knoppixe vypisalo chybu ze mu nieco chyba. Ale to je nepodstatne.)

    3. potom som pouzil skript python merge_dict.py a z foreign.txt czech.txt type.txt sa vytvorili en-cz-dictionary.txt a cz-en-dictionary.txt

    4.prikazom ./tabfile en-cz.dictionary.txt a ./tabfile cz-en...txt sa vytvorili .dz a .idx subory pre oba smery slovnika. Prikaz nesmie skoncit chybou. Ak skonci, treba odstranit nevhodne znaky z jednotlivych riadkov. Vacsinou mu vadi znak / . Prikaz vypise wordcount-y . (tabfile som pouzil originalny - po skompilovani stardictu)

    5. .ifo subory vytvorene v kroku 2 som doplnil: wordcount-y su z bodu 4 a idxfilesize sa zisti prikazom ls -l en-cz-dictionary.idx (a aj pre cz-en-dictionary.idx)

    6.treba nakopirovat .dz .idx. .ifo sub. napr. do /usr/share/stardict/example-dict

    7.Na overenie ci je slovnik spravne vytvoreny treba pouzit prikaz ./stardict_verify /cestakslovniku/vytvoreny_subor.ifo stardict_verify sa nachadza v adresari /src/tools po skompilovani stardictu.

    8.hotovo.
    belisarivs avatar 28.6.2006 21:57 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: Nefunguje
    No, ale to dela i ten skript samotny. Navic jeste vytvori ifo soubory a doplni do nich potrebne hodnoty. Mne to v pohode slapalo. Az na to ze jsem se musel docasne prepnout z UTF na iso8859-2.
    IRC is just multiplayer notepad.
    belisarivs avatar 28.6.2006 21:48 belisarivs | skóre: 22 | blog: Psychobláboly
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Nasel jsem dalsi databazi slovniku pro stardict:

    Jsou tam vesmes jiz ty zminene + nejake navic.
    IRC is just multiplayer notepad.
    6.7.2006 14:41 vymysleny | skóre: 10
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    ako zadefinujem wordcounty pre novovytvorne subory. Inac je to ok ked wc anglickeho je iny ako wc slovenskeho? Vyexportovane z PCtranslatora.
    jose17 avatar 6.7.2006 17:26 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    ako zadefinujem wordcounty pre novovytvorne subory.
    riadok wordcount= v .ifo súbore
    Inac je to ok ked wc anglickeho je iny ako wc slovenskeho?
    je to úplne OK. príklad slovníka: dog=pes;kamarát. wordcount pre anglicko-slovenský slovník: 1, opačne 2.
    Ja vim, on vi, ty nano!
    13.7.2006 15:49 TomCat1 | skóre: 10
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Použil jsem skript pro konverzi dat z PC Translatoru. Vše mi funguje, ale mezi přeloženými výrazy je vždy vynechán řádek. Že by chyba v tabfile? Použil jsem ten přiložený. Vám to zobrazuje správně?
    Have you tried turning it off and on again?
    jose17 avatar 15.7.2006 00:55 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    je to tak správne. čo význam, to nový odstavec.
    Ja vim, on vi, ty nano!
    19.7.2006 15:08 TomCat1 | skóre: 10
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Hmm, a proč je to tedy v GNU/FDL Česko-Anglickém a Anglicko-Českém slovníku hned pod sebou bez vynechaného řádku? (tak se mi to více líbí a zdá se mi to přehlednější)
    Have you tried turning it off and on again?
    jose17 avatar 19.7.2006 17:15 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    dajte mi prosím trochu viac času na odpoveď. momentálne pridávam ďalšie abecedy (nemčinu, taliančinu) a prepisujem do UTF-8 (už je to skutočne potrebné), takže to chvíľku potrvá. j.
    Ja vim, on vi, ty nano!
    29.8.2006 18:54 ferol
    Rozbalit Rozbalit vše databaza z iTranslatora z clanku
    neskusali ste niekto prerobit databazu z iTranslatora? ja sa v tych skriptoch vobec nevyznam, kedze som len obycajny uzivatel....ak to niekto mate nemozete mi to supnut na mail? feri_leho()yahoo.com, vdaka :)
    jose17 avatar 24.11.2006 13:48 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    ďalšie free slovníky, ktoré môžete veľmi jednoducho skonvertovať do StarDict formátu nájdete tu. jose
    Ja vim, on vi, ty nano!
    jose17 avatar 24.11.2006 22:39 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    a tu je mininávod:

    po rozzipovaní spustite na txtový súbor príkaz:
    tr -d '"' <subor.txt | iconv -f iso8859-1 -t utf-8 >slovnik.txt; tabfile slovnik.txt
    potom vytvorte .ifo súbor.
    Ja vim, on vi, ty nano!
    jose17 avatar 15.1.2007 10:49 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    kto by chcel latinsko-anglický slovník (wordcount: 39225), nech si stiahne túto databázu a na rozbalený súbor spustí
    perl -pe 's/#(.*?)  (.*?)    *\[.....\] :: (.*)/\1\t< \
    span size="smaller" color="darkseagreen">\2<\/span> \3/' DICTPAGE.RAW >\
    latin-english.txt
    ./tabfile latin-english.txt
    potom už len stačí v ifo súbore zmeniť sametypesequence z m na g a vytvoriť pre nový slovník adresár v ceste so slovníkmi StarDictu.
    Ja vim, on vi, ty nano!
    jose17 avatar 15.1.2007 14:55 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    databáza wtf (v súčasnosti asi 250 akronymov) je už prakticky pripravená na konverziu do StarDict formátu.
    Ja vim, on vi, ty nano!
    jose17 avatar 15.1.2007 16:00 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    jednoducho možno tiež skonvertovať jdict slovníky.
    #!/bin/bash
    # give the downloaded file a zip extension and within the archive locate
    # the file containing the word database
    # preview it and according to its content uncomment one of the lines
    #perl -pe "s/^ (.*?) : (.*?) :/\1\t\2/" "$1" | cstocs il1 utf8 >jdict-"$1" 
    #perl -pe "s/^ (.*?) \| (.*?) \|/\1\t\2/" "$1" | cstocs il1 utf8 >jdict-"$1" 
    ./tabfile jdict-"$1"
    Ja vim, on vi, ty nano!
    jose17 avatar 16.1.2007 14:37 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    pre skonvertovanie jdict slovníkov InterLingua:
    tr -d '\r' < Interlingua_English | awk 'getline a {print $0"\t"a} getline b {}'
    Ja vim, on vi, ty nano!
    jose17 avatar 16.1.2007 15:57 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    radšej použite toto:
    #!/bin/bash
    tr -d '\r' < "$1" | awk 'getline a {print $0"\t"a} getline b {}' \
    | cstocs il1 utf8 | sed -e "s/<br>//gi" -e "s/<hr>//gi" \
    | vi -c ":%s/<\([^>]*\)>/<\L\1>/g" -c ":w! jdict-$1" -c ":q" -
    ./tabfile jdict-"$1"
    Ja vim, on vi, ty nano!
    jose17 avatar 26.11.2007 14:41 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    pre PSC na Slovensku:
    dbview -bt -d\; file.dbf | awk -F\; '{print $1 "\t" $3 " " $4}' | iconv -f ibm852 -t utf-8 >file.out
    
    Ja vim, on vi, ty nano!
    31.7.2013 10:04 Attila
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Free slovníky pre goldendict a stardict sú na adrese: http://abloz.com/huzheng/stardict-dic/misc/
    18.5.2016 10:53 atirage21 | skóre: 10 | blog: attila
    Rozbalit Rozbalit vše Re: (Nielen) anglicko-české slovníkové databázy pre StarDict
    Ak by niekto potreboval slovensko-maďarský bezplatný slovník pod licenciou GPL, tak je to možné stiahnuť z mojej stránky: http://at-atelier.webnode.sk/spolupraca/

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.