abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 20:44 | IT novinky

    Americký výrobce čipů Nvidia získal od vlády prezidenta Donalda Trumpa souhlas s prodejem svých pokročilých počítačových čipů používaných k vývoji umělé inteligence (AI) H20 do Číny. Prodej těchto čipů speciálně upravených pro čínský trh by tak mohl být brzy obnoven, uvedla firma na svém blogu. Americká vláda zakázala prodej v dubnu, v době eskalace obchodního sporu mezi oběma zeměmi. Tehdy to zdůvodnila obavami, že by čipy mohla využívat čínská armáda.

    Ladislav Hagara | Komentářů: 0
    dnes 17:22 | Nová verze

    3D software Blender byl vydán ve verzi 4.5 s prodlouženou podporou. Podrobnosti v poznámkách k vydání. Videopředstavení na YouTube.

    Ladislav Hagara | Komentářů: 0
    včera 22:22 | Komunita

    Open source webový aplikační framework Django slaví 20. narozeniny.

    Ladislav Hagara | Komentářů: 0
    včera 16:11 | Komunita

    V Brestu dnes začala konference vývojářů a uživatelů linuxové distribuce Debian DebConf25. Na programu je řada zajímavých přednášek. Sledovat je lze online.

    Ladislav Hagara | Komentářů: 0
    včera 11:33 | IT novinky

    Před 30 lety, tj. 14. července 1995, se začala používat přípona .mp3 pro soubory s hudbou komprimovanou pomocí MPEG-2 Audio Layer 3.

    Ladislav Hagara | Komentářů: 26
    včera 10:55 | IT novinky

    Výroba 8bitových domácích počítačů Commodore 64 byla ukončena v dubnu 1994. Po více než 30 letech byl představen nový oficiální Commodore 64 Ultimate (YouTube). S deskou postavenou na FPGA. Ve 3 edicích v ceně od 299 dolarů a plánovaným dodáním v říjnu a listopadu letošního roku.

    Ladislav Hagara | Komentářů: 20
    13.7. 17:55 | Zajímavý projekt

    Společnost Hugging Face ve spolupráci se společností Pollen Robotics představila open source robota Reachy Mini (YouTube). Předobjednat lze lite verzi za 299 dolarů a wireless verzi s Raspberry Pi 5 za 449 dolarů.

    Ladislav Hagara | Komentářů: 17
    11.7. 16:44 | Komunita

    Dnes v 17:30 bude oficiálně vydána open source počítačová hra DOGWALK vytvořena v 3D softwaru Blender a herním enginu Godot. Release party proběhne na YouTube od 17:00.

    Ladislav Hagara | Komentářů: 3
    11.7. 14:55 | Humor

    McDonald's se spojil se společností Paradox a pracovníky nabírá také pomocí AI řešení s virtuální asistentkou Olivii běžící na webu McHire. Ian Carroll a Sam Curry se na toto AI řešení blíže podívali a opravdu je překvapilo, že se mohli přihlásit pomocí jména 123456 a hesla 123456 a získat přístup k údajům o 64 milionech uchazečů o práci.

    Ladislav Hagara | Komentářů: 16
    11.7. 00:11 | Nová verze

    Byla vydána (𝕏) červnová aktualizace aneb nová verze 1.102 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.102 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    Jaký je váš oblíbený skriptovací jazyk?
     (59%)
     (26%)
     (7%)
     (3%)
     (1%)
     (1%)
     (4%)
    Celkem 397 hlasů
     Komentářů: 16, poslední 8.6. 21:05
    Rozcestník

    Srovnání několika OCR programů

    Pokud občas skenujete texty a nejste spokojeni s programem GOCR, mohl by vás zaujmout článek na groundstate.ca, srovnávající linuxové OCR programy. V článku se testují programy jako Clara, Ocre, Tesseract, Ocropus a další.

    24.5.2007 18:16 | otula | Zajímavý článek


    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    otula avatar 25.5.2007 00:03 otula | skóre: 45 | blog: otakar | Adamov
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Tak jsem si zkompiloval OCRopus a Tesseract, fungují, ale nemám páru, jak je naučit česky. A na stránkách jsem našel jen to, že to jde, ale ne jak. Poradíte někdo?
    Kdo vám tvrdí, že jste paranoidní, ten v tom spiknutí s největší pravděpodobností jede taky.
    25.5.2007 00:25 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Tesseract nijak :( zbytek neznám
    otula avatar 25.5.2007 00:38 otula | skóre: 45 | blog: otakar | Adamov
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Hm, ale OCRopus by se měl určitě dát naučit jiné řeči, než jen angličtinu. Nebýt této „drobnosti“, tak ten výsledek vypadá slušně.
    Kdo vám tvrdí, že jste paranoidní, ten v tom spiknutí s největší pravděpodobností jede taky.
    25.5.2007 07:15 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Faktem je, že tyhle zmíněné programy fungují docela slušně, do chvíle než dojde na diakritiku. Bohužel paradoxně i opravdu kvalitní OCR aplikace i pro jiné platformy jdou podivnými cestami, protože např. Read Iris 10 dává mnohem lepší výsledky než verze 11 (Jinak Read I.R.I.S. 10 funguje bez problémů pod wine a dává opravdu dobré výsledky, asi nejlepší z toho co jsem testoval)
    25.5.2007 10:17 Badolf
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    kdysi sem testoval finereader (tusim 8.0) pod wine a take to chodilo velmi uspokojive.
    25.5.2007 10:39 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Existují dva extrémní přístupy: buďto zadrátovat znalost konkrétních písem, nebo plně inteligentí zpracování.

    Oba přístupy se často kombinují, v komerčním světě však převládá ten první. Takže takové programy fungují jen na předem připraveném písmu (často implicitní fonty z Windows).

    Metoda úplného učení se s oblibou používá u konvertorů bitmapových titulků k filmům do textu. Tam je písmo velmi jednoduché a pracuje se často s celými slovy (uživatel je dotazován, co je to za slovo, a po vyčerpání slovní zásoby herců pracuje prakticky automaticky), což je výhodné u nesklonných jazyků jako je angličtina.

    Dalším problémem je předzpracování textu (osazování bounding boxů, hledání účaří), kdy je u diakritiky problém spojit znaménko s písmenem. Paradoxně program umožňující rozpoznávání volného textu (tj. ne jen textu v řádku), je na tom hůře, protože považuje znaménka za samostatná písmena (např. z háčku dělá „e“).

    Před necelým rokem jsem se zabýval GOCR a konečně se byl začleněn základ pro učení se znaků. Tehdy se už uměl ptát, ale neměl naučené znaky opakovaně rozpoznat. Autoři slibovali, že se v tomto směru polepší.
    31.7.2007 13:51 chmelej
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    vypada to ze od verze 2.00 je mozne tesseract ucit i dalsi jazyky, ale do cestiny se zrejme jeste nikdo nepustil. viz. http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract

    Založit nové vláknoNahoru


    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.