abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 19:22 | Nová verze

    Byl vydán AlmaLinux OS 10 s kódovým názvem Purple Lion. Podrobnosti v poznámkách k vydání. Na rozdíl od Red Hat Enterprise Linuxu 10 nadále podporuje x86-64-v2.

    Ladislav Hagara | Komentářů: 0
    dnes 15:11 | Nová verze

    Byl vydán Mozilla Firefox 139.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 139 je již k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    dnes 10:44 | Komunita

    Byly publikovány výsledky průzkumu mezi uživateli Blenderu uskutečněného v říjnu 2024. Zúčastnilo se více než 7000 uživatelů. Téměř 93 % z nich například používá uživatelské rozhraní v angličtině.

    Ladislav Hagara | Komentářů: 2
    včera 23:55 | Zajímavý článek

    Lukáš Růžička v článku RamaLama aneb vyháníme lamy na vlastní louku na MojeFedora.cz představuje open source nástroj RamaLama umožňující spouštět jazykové modely v izolovaných OCI kontejnerech, a to bezpečně, bez potřeby mít root přístup k počítači, s podporou GPU či CPU a bez zbytečných obtížností kolem.

    Ladislav Hagara | Komentářů: 0
    včera 22:55 | Nová verze

    Byl vydán Sublime Text 4 Build 4200. Sublime Text (Wikipedie) je proprietární multiplatformní editor textových souborů a zdrojových kódů. Ke stažení a k vyzkoušení je zdarma. Pro další používání je nutná licence v ceně 99 dolarů. Spolu se Sublime Merge je cena 168 dolarů.

    Ladislav Hagara | Komentářů: 0
    včera 18:00 | Nová verze

    Multiplatformní open source voxelový herní engine Luanti byl vydán ve verzi 5.12.0. Podrobný přehled novinek v changelogu. Původně se jedná o Minecraftem inspirovaný Minetest v říjnu loňského roku přejmenovaný na Luanti.

    Ladislav Hagara | Komentářů: 0
    včera 16:11 | Nová verze

    Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu optimalizovaná pro jednodeskové počítače na platformě ARM a RISC-V, ke stažení ale také pro Intel a AMD, byl vydán ve verzi 25.5. Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 0
    včera 13:00 | Komunita

    Po 25 letech s číslem 329 končí linuxový časopis Linux Format (Wikipedie, reddit, 𝕏).

    Ladislav Hagara | Komentářů: 1
    včera 12:00 | Zajímavý software

    Immich z balíčků open source aplikací FUTO je alternativa k výchozím aplikacím od Googlu a Applu pro správu fotografií a videí. Umožňuje vlastní hosting serveru Immich. Zdrojové kódy jsou k dispozici na GitHubu pod licencí AGPL-3.0.

    Ladislav Hagara | Komentářů: 5
    včera 02:22 | Nová verze

    Po 9 týdnech vývoje od vydání Linuxu 6.14 oznámil Linus Torvalds vydání Linuxu 6.15. Přehled novinek a vylepšení na LWN.net: první a druhá polovina začleňovacího okna a Linux Kernel Newbies.

    Ladislav Hagara | Komentářů: 0
    Jaký je váš oblíbený skriptovací jazyk?
     (54%)
     (31%)
     (8%)
     (3%)
     (0%)
     (0%)
     (4%)
    Celkem 133 hlasů
     Komentářů: 11, poslední dnes 15:10
    Rozcestník

    Srovnání několika OCR programů

    Pokud občas skenujete texty a nejste spokojeni s programem GOCR, mohl by vás zaujmout článek na groundstate.ca, srovnávající linuxové OCR programy. V článku se testují programy jako Clara, Ocre, Tesseract, Ocropus a další.

    24.5.2007 18:16 | otula | Zajímavý článek


    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    otula avatar 25.5.2007 00:03 otula | skóre: 45 | blog: otakar | Adamov
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Tak jsem si zkompiloval OCRopus a Tesseract, fungují, ale nemám páru, jak je naučit česky. A na stránkách jsem našel jen to, že to jde, ale ne jak. Poradíte někdo?
    Kdo vám tvrdí, že jste paranoidní, ten v tom spiknutí s největší pravděpodobností jede taky.
    25.5.2007 00:25 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Tesseract nijak :( zbytek neznám
    otula avatar 25.5.2007 00:38 otula | skóre: 45 | blog: otakar | Adamov
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Hm, ale OCRopus by se měl určitě dát naučit jiné řeči, než jen angličtinu. Nebýt této „drobnosti“, tak ten výsledek vypadá slušně.
    Kdo vám tvrdí, že jste paranoidní, ten v tom spiknutí s největší pravděpodobností jede taky.
    25.5.2007 07:15 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Faktem je, že tyhle zmíněné programy fungují docela slušně, do chvíle než dojde na diakritiku. Bohužel paradoxně i opravdu kvalitní OCR aplikace i pro jiné platformy jdou podivnými cestami, protože např. Read Iris 10 dává mnohem lepší výsledky než verze 11 (Jinak Read I.R.I.S. 10 funguje bez problémů pod wine a dává opravdu dobré výsledky, asi nejlepší z toho co jsem testoval)
    25.5.2007 10:17 Badolf
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    kdysi sem testoval finereader (tusim 8.0) pod wine a take to chodilo velmi uspokojive.
    25.5.2007 10:39 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    Existují dva extrémní přístupy: buďto zadrátovat znalost konkrétních písem, nebo plně inteligentí zpracování.

    Oba přístupy se často kombinují, v komerčním světě však převládá ten první. Takže takové programy fungují jen na předem připraveném písmu (často implicitní fonty z Windows).

    Metoda úplného učení se s oblibou používá u konvertorů bitmapových titulků k filmům do textu. Tam je písmo velmi jednoduché a pracuje se často s celými slovy (uživatel je dotazován, co je to za slovo, a po vyčerpání slovní zásoby herců pracuje prakticky automaticky), což je výhodné u nesklonných jazyků jako je angličtina.

    Dalším problémem je předzpracování textu (osazování bounding boxů, hledání účaří), kdy je u diakritiky problém spojit znaménko s písmenem. Paradoxně program umožňující rozpoznávání volného textu (tj. ne jen textu v řádku), je na tom hůře, protože považuje znaménka za samostatná písmena (např. z háčku dělá „e“).

    Před necelým rokem jsem se zabýval GOCR a konečně se byl začleněn základ pro učení se znaků. Tehdy se už uměl ptát, ale neměl naučené znaky opakovaně rozpoznat. Autoři slibovali, že se v tomto směru polepší.
    31.7.2007 13:51 chmelej
    Rozbalit Rozbalit vše Re: Srovnání několika OCR programů
    vypada to ze od verze 2.00 je mozne tesseract ucit i dalsi jazyky, ale do cestiny se zrejme jeste nikdo nepustil. viz. http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract

    Založit nové vláknoNahoru


    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.