abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 11:33 | IT novinky

    IBM kupuje za 11 miliard USD (229,1 miliardy Kč) firmu Confluent zabývající se datovou infrastrukturou. Posílí tak svoji nabídku cloudových služeb a využije růstu poptávky po těchto službách, který je poháněný umělou inteligencí.

    Ladislav Hagara | Komentářů: 0
    dnes 01:55 | IT novinky

    Nejvyšší správní soud (NSS) podruhé zrušil pokutu za únik zákaznických údajů z e-shopu Mall.cz. Incidentem se musí znovu zabývat Úřad pro ochranu osobních údajů (ÚOOÚ). Samotný únik ještě neznamená, že správce dat porušil svou povinnost zajistit jejich bezpečnost, plyne z rozsudku dočasně zpřístupněného na úřední desce. Úřad musí vždy posoudit, zda byla přijatá opatření přiměřená povaze rizik, stavu techniky a nákladům.

    Ladislav Hagara | Komentářů: 4
    včera 18:44 | Komunita

    Organizace Free Software Foundation Europe (FSFE) zrušila svůj účet na 𝕏 (Twitter) s odůvodněním: "To, co mělo být původně místem pro dialog a výměnu informací, se proměnilo v centralizovanou arénu nepřátelství, dezinformací a ziskem motivovaného řízení, což je daleko od ideálů svobody, za nimiž stojíme". FSFE je aktivní na Mastodonu.

    Ladislav Hagara | Komentářů: 23
    včera 17:55 | IT novinky

    Paramount nabízí za celý Warner Bros. Discovery 30 USD na akcii, tj. celkově o 18 miliard USD více než nabízí Netflix. V hotovosti.

    Ladislav Hagara | Komentářů: 3
    včera 13:22 | IT novinky

    Nájemný botnet Aisuru prolomil další "rekord". DDoS útok na Cloudflare dosáhl 29,7 Tbps. Aisuru je tvořený až čtyřmi miliony kompromitovaných zařízení.

    Ladislav Hagara | Komentářů: 5
    včera 12:11 | Nová verze

    Iced, tj. multiplatformní GUI knihovna pro Rust, byla vydána ve verzi 0.14.0.

    Ladislav Hagara | Komentářů: 3
    včera 05:22 | Komunita

    FEX, tj. open source emulátor umožňující spouštět aplikace pro x86 a x86_64 na architektuře ARM64, byl vydán ve verzi 2512. Před pár dny FEX oslavil sedmé narozeniny. Hlavní vývojář FEXu Ryan Houdek v oznámení poděkoval společnosti Valve za podporu. Pierre-Loup Griffais z Valve, jeden z architektů stojících za SteamOS a Steam Deckem, v rozhovoru pro The Verge potvrdil, že FEX je od svého vzniku sponzorován společností Valve.

    Ladislav Hagara | Komentářů: 0
    včera 03:22 | Nová verze

    Byla vydána nová verze 2.24 svobodného video editoru Flowblade (GitHub, Wikipedie). Přehled novinek v poznámkách k vydání. Videoukázky funkcí Flowblade na Vimeu. Instalovat lze také z Flathubu.

    Ladislav Hagara | Komentářů: 0
    7.12. 15:11 | IT novinky

    Společnost Proton AG stojící za Proton Mailem a dalšími službami přidala do svého portfolia online tabulky Proton Sheets v Proton Drive.

    Ladislav Hagara | Komentářů: 12
    6.12. 15:55 | Komunita

    O víkendu (15:00 až 23:00) probíha EmacsConf 2025, tj. online konference vývojářů a uživatelů editoru GNU Emacs. Sledovat ji lze na stránkách konference. Záznamy budou k dispozici přímo z programu.

    Ladislav Hagara | Komentářů: 1
    Jaké řešení používáte k vývoji / práci?
     (34%)
     (48%)
     (19%)
     (17%)
     (22%)
     (15%)
     (24%)
     (16%)
     (18%)
    Celkem 447 hlasů
     Komentářů: 18, poslední 2.12. 18:34
    Rozcestník

    Srovnání několika OCR programů

    Pokud občas skenujete texty a nejste spokojeni s programem GOCR, mohl by vás zaujmout článek na groundstate.ca, srovnávající linuxové OCR programy. V článku se testují programy jako Clara, Ocre, Tesseract, Ocropus a další.

    24.5.2007 18:16 | otula | Zajímavý článek


    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    otula avatar 25.5.2007 00:03 otula | skóre: 45 | blog: otakar | Adamov
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Tak jsem si zkompiloval OCRopus a Tesseract, fungují, ale nemám páru, jak je naučit česky. A na stránkách jsem našel jen to, že to jde, ale ne jak. Poradíte někdo?
    Kdo vám tvrdí, že jste paranoidní, ten v tom spiknutí s největší pravděpodobností jede taky.
    25.5.2007 00:25 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Tesseract nijak :( zbytek neznám
    otula avatar 25.5.2007 00:38 otula | skóre: 45 | blog: otakar | Adamov
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Hm, ale OCRopus by se měl určitě dát naučit jiné řeči, než jen angličtinu. Nebýt této „drobnosti“, tak ten výsledek vypadá slušně.
    Kdo vám tvrdí, že jste paranoidní, ten v tom spiknutí s největší pravděpodobností jede taky.
    25.5.2007 07:15 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Faktem je, že tyhle zmíněné programy fungují docela slušně, do chvíle než dojde na diakritiku. Bohužel paradoxně i opravdu kvalitní OCR aplikace i pro jiné platformy jdou podivnými cestami, protože např. Read Iris 10 dává mnohem lepší výsledky než verze 11 (Jinak Read I.R.I.S. 10 funguje bez problémů pod wine a dává opravdu dobré výsledky, asi nejlepší z toho co jsem testoval)
    25.5.2007 10:17 Badolf
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    kdysi sem testoval finereader (tusim 8.0) pod wine a take to chodilo velmi uspokojive.
    25.5.2007 10:39 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Existují dva extrémní přístupy: buďto zadrátovat znalost konkrétních písem, nebo plně inteligentí zpracování.

    Oba přístupy se často kombinují, v komerčním světě však převládá ten první. Takže takové programy fungují jen na předem připraveném písmu (často implicitní fonty z Windows).

    Metoda úplného učení se s oblibou používá u konvertorů bitmapových titulků k filmům do textu. Tam je písmo velmi jednoduché a pracuje se často s celými slovy (uživatel je dotazován, co je to za slovo, a po vyčerpání slovní zásoby herců pracuje prakticky automaticky), což je výhodné u nesklonných jazyků jako je angličtina.

    Dalším problémem je předzpracování textu (osazování bounding boxů, hledání účaří), kdy je u diakritiky problém spojit znaménko s písmenem. Paradoxně program umožňující rozpoznávání volného textu (tj. ne jen textu v řádku), je na tom hůře, protože považuje znaménka za samostatná písmena (např. z háčku dělá „e“).

    Před necelým rokem jsem se zabýval GOCR a konečně se byl začleněn základ pro učení se znaků. Tehdy se už uměl ptát, ale neměl naučené znaky opakovaně rozpoznat. Autoři slibovali, že se v tomto směru polepší.
    31.7.2007 13:51 chmelej
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    vypada to ze od verze 2.00 je mozne tesseract ucit i dalsi jazyky, ale do cestiny se zrejme jeste nikdo nepustil. viz. http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract

    Založit nové vláknoNahoru


    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.