abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 15:22 | Zajímavý článek

    Nové číslo časopisu Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 160 (pdf).

    Ladislav Hagara | Komentářů: 0
    dnes 14:11 | IT novinky

    Izrael od února zakáže dětem používat v prostorách základních škol mobilní telefony. Podle agentury AFP to uvedlo izraelské ministerstvo školství, které zdůraznilo negativní dopady, které na žactvo používání telefonů má. Izrael se tímto krokem přidává k rostoucímu počtu zemí, které dětem ve vzdělávacích zařízeních přístup k telefonům omezují.

    Ladislav Hagara | Komentářů: 10
    dnes 14:00 | IT novinky

    Internetová společnost Google ze skupiny Alphabet pravděpodobně dostane příští rok pokutu od Evropské komise za nedostatečné dodržování pravidel proti upřednostňování vlastních služeb a produktů ve výsledcích vyhledávání. V březnu EK obvinila Google, že ve výsledcích vyhledávání upřednostňuje na úkor konkurence vlastní služby, například Google Shopping, Google Hotels a Google Flights. Případ staví Google proti specializovaným

    … více »
    Ladislav Hagara | Komentářů: 5
    dnes 12:22 | Pozvánky

    Byl oznámen program a spuštěna registrace na konferenci Prague PostgreSQL Developer Day 2026. Konference se koná 27. a 28. ledna a bude mít tři tracky s 18 přednáškami a jeden den workshopů.

    TomasVondra | Komentářů: 0
    dnes 12:11 | Pozvánky

    Na webu československého síťařského setkání CSNOG 2026 je vyvěšený program, registrace a další informace k akci. CSNOG 2026 se uskuteční 21. a 22. ledna příštího roku a bude se i tentokrát konat ve Zlíně. Přednášky, kterých bude více než 30, budou opět rozdělené do tří bloků - správa sítí, legislativa a regulace a akademické projekty. Počet míst je omezený, proto kdo má zájem, měl by se registrovat co nejdříve.

    VSladek | Komentářů: 0
    včera 00:44 | Zajímavý článek

    Máirín Duffy a Brian Smith v článku pro Fedora Magazine ukazují použití LLM pro diagnostiku systému (Fedora Linuxu) přes Model Context Protocol od firmy Anthropic. I ukázkové výstupy v samotném článku obsahují AI vygenerované nesmysly, např. doporučení přeinstalovat balíček pomocí správce balíčků APT z Debianu místo DNF nativního na Fedoře.

    |🇵🇸 | Komentářů: 34
    13.12. 04:55 | Zajímavý software

    Projekt D7VK dospěl do verze 1.0. Jedná se o fork DXVK implementující překlad volání Direct3D 7 na Vulkan. DXVK zvládá Direct3D 8, 9, 10 a 11.

    Ladislav Hagara | Komentářů: 1
    12.12. 16:00 | Nová verze

    Byla vydána nová verze 2025.4 linuxové distribuce navržené pro digitální forenzní analýzu a penetrační testování Kali Linux (Wikipedie). Přehled novinek se seznamem nových nástrojů v oficiálním oznámení na blogu.

    Ladislav Hagara | Komentářů: 2
    12.12. 12:44 | IT novinky

    Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) zveřejnil Národní politiku koordinovaného zveřejňování zranitelností (pdf), jejímž cílem je nejen zvyšování bezpečnosti produktů informačních a komunikačních technologií (ICT), ale také ochrana objevitelů zranitelností před negativními právními dopady. Součástí je rovněž vytvoření „koordinátora pro účely CVD“, jímž je podle nového zákona o kybernetické … více »

    Ladislav Hagara | Komentářů: 30
    12.12. 04:33 | Nová verze

    Vývojáři KDE oznámili vydání balíku aplikací KDE Gear 25.12. Přehled novinek i s náhledy a videi v oficiálním oznámení.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (48%)
     (19%)
     (17%)
     (22%)
     (14%)
     (24%)
     (15%)
     (17%)
    Celkem 467 hlasů
     Komentářů: 19, poslední 11.12. 20:04
    Rozcestník

    Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý

    28.9.2006 12:59 | Přečteno: 5724× | Výběrový blog | poslední úprava: 15.4.2007 16:17

    Po téměř úplném přechodu na Linux přibližně před rokem jsem přestal používat OCR jelikož jsem na to nenašel žádný použitelný software pro Linux zdarma. Nic z toho co jsem zkoušel nefungovalo. Google nedávno informoval o uvolnění OCR engine Tesseract pod licencí Apache 2.0. Dnešní článek na Newsforge mi to připomněl, tak jsem se rozhodl Tesseract vyzkoušet. Zdrojový kód je ke stažení ze Sourceforge. Kompilace a instalace je snadná a rychlá (Ubuntu 6.06): $ ./configure; make; sudo checkinstall -D. Tesseract však poté nefunguje. Je ještě třeba dát adresář tessdata/ do /usr/local/bin/.

    Dal jsem Tesseractu přečíst stránku jednoho článku ve formátu tiff ($ tesseract test.tif test). Ta jedna stránka má 17 MB (scan z kopírky v knihovně) a Tesseract ji přečetl skoro hned. Existuje i skript na převod souborů pro Tesseract. Vzniklý soubor test.txt je minimálně stejně dobrý jako výstupy z různých programů co jsem používal ve Windows (nepamatuju kterých, prostě nějaký shareware). Je tam pár chyb, ale jsem mile překvapen. Zdá se že znovu začnu využívat OCR.

    
    

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    28.9.2006 13:29 medulin | skóre: 31 | blog: medulin | ČR
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    A jak je na tom z českými znaky?
    stativ avatar 28.9.2006 13:53 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Staci si precist ten clanek na linux.com- podpora pro jine nez us-ascii znaky neni.
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    28.9.2006 13:54 frdrx | skóre: 29 | blog: frdrx
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Sám jsem na to nepomyslel, protože s češtinou skoro nedělám. Teď jsem to zkusil a, jak jsem očekával, je to špatný. Český znaky zatím nezná.
    Patička mi slouží k tomu, abych si lépe poznal svoje příspěvky.
    28.9.2006 14:02 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Pridej ho prosim do katalogu software ..
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    28.9.2006 14:27 miso | skóre: 36 | blog: iSCSI_initiator_howto | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Hura, konecne!
    z toho katalogu mam radost ;-)
    Project Satan infects Calculon with Werecar virus
    28.9.2006 15:29 Kyosuke | skóre: 28 | blog: nalady_v_modre
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Hihihi … :-D Těší mně, jmenuju se Google … :-D
    28.9.2006 19:47 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Pane Google, proč je Google Web Toolkit zrovna v Javě? :-D
    When your hammer is C++, everything begins to look like a thumb.
    28.9.2006 22:26 Kyosuke | skóre: 28 | blog: nalady_v_modre
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    To já nevím, jak je vidět, dělám jim jen tiskového mluvčího … :-D (Něco jako Ústa Sauronova? :-))
    28.9.2006 18:41 pasmen | skóre: 45 | blog: glob | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Me by spis zajimalo, jestli by nekdo nevedel o nejakem software pro linux (at uz placeny nebo free, free radsi :) ktery by umel cist carove kody z naskenovanych dokumentu. Neco jako nemecky DocumentAssembler.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.