abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 04:22 | Pozvánky

    Letos se uskuteční již 11. ročník soutěže v programování Kasiopea. Tato soutěž, (primárně) pro středoškoláky, nabízí skvělou příležitost procvičit logické myšlení a dozvědět se něco nového ze světa algoritmů – a to nejen pro zkušené programátory, ale i pro úplné začátečníky. Domácí kolo proběhne online od 22. 11. do 7. 12. 2025 a skládá se z 9 zajímavých úloh různé obtížnosti. Na výběru programovacího jazyka přitom nezáleží – úlohy jsou

    … více »
    SoutezKasiopea | Komentářů: 0
    dnes 04:11 | Nová verze

    Byla vydána nová verze 2.52.0 distribuovaného systému správy verzí Git. Přispělo 94 vývojářů, z toho 33 nových. Přehled novinek v příspěvku na blogu GitHubu a v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 18:00 | Nová verze

    VKD3D-Proton byl vydán ve verzi 3.0. Jedná se fork knihovny vkd3d z projektu Wine pro Proton. Knihovna slouží pro překlad volání Direct3D 12 na Vulkan. V přehledu novinek je vypíchnuta podpora AMD FSR 4 (AMD FidelityFX Super Resolution 4).

    Ladislav Hagara | Komentářů: 0
    včera 03:11 | Nová verze

    Poštovní klient Thunderbird byl vydán v nové verzi 145.0. Podporuje DNS přes HTTPS nebo Microsoft Exchange skrze Exchange Web Services. Ukončena byla podpora 32bitového Thunderbirdu pro Linux.

    Ladislav Hagara | Komentářů: 1
    včera 02:33 | IT novinky

    U příležitosti státního svátku 17. listopadu probíhá na Steamu i GOG.com již šestý ročník Czech & Slovak Games Week aneb týdenní oslava a také slevová akce českých a slovenských počítačových her.

    Ladislav Hagara | Komentářů: 0
    16.11. 19:33 | Nová verze

    Byla vydána nová verze 9.19 z Debianu vycházející linuxové distribuce DietPi pro (nejenom) jednodeskové počítače. Přehled novinek v poznámkách k vydání. Vypíchnout lze například nový balíček BirdNET-Go, tj. AI řešení pro nepřetržité monitorování a identifikaci ptáků.

    Ladislav Hagara | Komentářů: 0
    16.11. 02:22 | Nová verze

    Byla vydána nová verze 3.38 frameworku Flutter (Wikipedie) pro vývoj mobilních, webových i desktopových aplikací a nová verze 3.10 souvisejícího programovacího jazyka Dart (Wikipedie).

    Ladislav Hagara | Komentářů: 0
    16.11. 01:33 | Nová verze

    Organizace Apache Software Foundation (ASF) vydala verzi 28 integrovaného vývojového prostředí a vývojové platformy napsané v Javě NetBeans (Wikipedie). Přehled novinek na GitHubu. Instalovat lze také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 0
    15.11. 16:11 | Nová verze

    Byl vydán Debian 13.2, tj. druhá opravná verze Debianu 13 s kódovým názvem Trixie. Řešeny jsou především bezpečnostní problémy, ale také několik vážných chyb. Instalační média Debianu 13 lze samozřejmě nadále k instalaci používat. Po instalaci stačí systém aktualizovat.

    Ladislav Hagara | Komentářů: 0
    15.11. 12:11 | IT novinky

    Google představil platformu Code Wiki pro rychlejší porozumění existujícímu kódu. Code Wiki pomocí AI Gemini udržuje průběžně aktualizovanou strukturovanou wiki pro softwarové repozitáře. Zatím jenom pro veřejné. V plánu je rozšíření Gemini CLI také pro soukromé a interní repozitáře.

    Ladislav Hagara | Komentářů: 5
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (46%)
     (19%)
     (18%)
     (23%)
     (15%)
     (23%)
     (16%)
     (16%)
    Celkem 362 hlasů
     Komentářů: 16, poslední 12.11. 18:21
    Rozcestník

    Srovnání několika OCR programů

    Pokud občas skenujete texty a nejste spokojeni s programem GOCR, mohl by vás zaujmout článek na groundstate.ca, srovnávající linuxové OCR programy. V článku se testují programy jako Clara, Ocre, Tesseract, Ocropus a další.

    24.5.2007 18:16 | otula | Zajímavý článek


    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    otula avatar 25.5.2007 00:03 otula | skóre: 45 | blog: otakar | Adamov
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Tak jsem si zkompiloval OCRopus a Tesseract, fungují, ale nemám páru, jak je naučit česky. A na stránkách jsem našel jen to, že to jde, ale ne jak. Poradíte někdo?
    Kdo vám tvrdí, že jste paranoidní, ten v tom spiknutí s největší pravděpodobností jede taky.
    25.5.2007 00:25 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Tesseract nijak :( zbytek neznám
    otula avatar 25.5.2007 00:38 otula | skóre: 45 | blog: otakar | Adamov
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Hm, ale OCRopus by se měl určitě dát naučit jiné řeči, než jen angličtinu. Nebýt této „drobnosti“, tak ten výsledek vypadá slušně.
    Kdo vám tvrdí, že jste paranoidní, ten v tom spiknutí s největší pravděpodobností jede taky.
    25.5.2007 07:15 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Faktem je, že tyhle zmíněné programy fungují docela slušně, do chvíle než dojde na diakritiku. Bohužel paradoxně i opravdu kvalitní OCR aplikace i pro jiné platformy jdou podivnými cestami, protože např. Read Iris 10 dává mnohem lepší výsledky než verze 11 (Jinak Read I.R.I.S. 10 funguje bez problémů pod wine a dává opravdu dobré výsledky, asi nejlepší z toho co jsem testoval)
    25.5.2007 10:17 Badolf
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    kdysi sem testoval finereader (tusim 8.0) pod wine a take to chodilo velmi uspokojive.
    25.5.2007 10:39 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Existují dva extrémní přístupy: buďto zadrátovat znalost konkrétních písem, nebo plně inteligentí zpracování.

    Oba přístupy se často kombinují, v komerčním světě však převládá ten první. Takže takové programy fungují jen na předem připraveném písmu (často implicitní fonty z Windows).

    Metoda úplného učení se s oblibou používá u konvertorů bitmapových titulků k filmům do textu. Tam je písmo velmi jednoduché a pracuje se často s celými slovy (uživatel je dotazován, co je to za slovo, a po vyčerpání slovní zásoby herců pracuje prakticky automaticky), což je výhodné u nesklonných jazyků jako je angličtina.

    Dalším problémem je předzpracování textu (osazování bounding boxů, hledání účaří), kdy je u diakritiky problém spojit znaménko s písmenem. Paradoxně program umožňující rozpoznávání volného textu (tj. ne jen textu v řádku), je na tom hůře, protože považuje znaménka za samostatná písmena (např. z háčku dělá „e“).

    Před necelým rokem jsem se zabýval GOCR a konečně se byl začleněn základ pro učení se znaků. Tehdy se už uměl ptát, ale neměl naučené znaky opakovaně rozpoznat. Autoři slibovali, že se v tomto směru polepší.
    31.7.2007 13:51 chmelej
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    vypada to ze od verze 2.00 je mozne tesseract ucit i dalsi jazyky, ale do cestiny se zrejme jeste nikdo nepustil. viz. http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract

    Založit nové vláknoNahoru


    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.