abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 17:11 | IT novinky

    Proběhla hackerská soutěž Pwn2Own Ireland 2025. Celkově bylo vyplaceno 1 024 750 dolarů za 73 unikátních zranitelností nultého dne (0-day). Vítězný Summoning Team si odnesl 187 500 dolarů. Shrnutí po jednotlivých dnech na blogu Zero Day Initiative (1. den, 2. den a 3. den) a na YouTube.

    Ladislav Hagara | Komentářů: 1
    včera 13:33 | Komunita

    Byl publikován říjnový přehled dění a novinek z vývoje Asahi Linuxu, tj. Linuxu pro Apple Silicon. Pracuje se na podpoře M3. Zanedlouho vyjde Fedora Asahi Remix 43. Vývojáře lze podpořit na Open Collective a GitHub Sponsors.

    Ladislav Hagara | Komentářů: 0
    25.10. 15:44 | Zajímavý software

    Iniciativa Open Device Partnership (ODP) nedávno představila projekt Patina. Jedná se o implementaci UEFI firmwaru v Rustu. Vývoj probíhá na GitHubu. Zdrojové kódy jsou k dispozici pod licencí Apache 2.0. Nejnovější verze Patiny je 13.0.0.

    Ladislav Hagara | Komentářů: 0
    25.10. 05:11 | Zajímavý článek

    Obrovská poptávka po plynových turbínách zapříčinila, že datová centra začala používat v generátorech dodávajících energii pro provoz AI staré dobré proudové letecké motory, konvertované na plyn. Jejich výhodou je, že jsou menší, lehčí a lépe udržovatelné než jejich průmyslové protějšky. Proto jsou ideální pro dočasné nebo mobilní použití.

    karkar | Komentářů: 9
    24.10. 19:55 | Nová verze

    Typst byl vydán ve verzi 0.14. Jedná se o rozšiřitelný značkovací jazyk a překladač pro vytváření dokumentů včetně odborných textů s matematickými vzorci, diagramy či bibliografií.

    Ladislav Hagara | Komentářů: 0
    24.10. 13:33 | Bezpečnostní upozornění

    Specialisté společnosti ESET zaznamenali útočnou kampaň, která cílí na uživatele a uživatelky v Česku a na Slovensku. Útočníci po telefonu zmanipulují oběť ke stažení falešné aplikace údajně od České národní banky (ČNB) nebo Národní banky Slovenska (NBS), přiložení platební karty k telefonu a zadání PINu. Malware poté v reálném čase přenese data z karty útočníkovi, který je bezkontaktně zneužije u bankomatu nebo na platebním terminálu.

    Ladislav Hagara | Komentářů: 21
    24.10. 13:22 | Upozornění

    V Ubuntu 25.10 byl balíček základních nástrojů gnu-coreutils nahrazen balíčkem rust-coreutils se základními nástroji přepsanými do Rustu. Ukázalo se, že nový "date" znefunkčnil automatickou aktualizaci. Pro obnovu je nutno balíček rust-coreutils manuálně aktualizovat.

    Ladislav Hagara | Komentářů: 13
    24.10. 04:55 | Komunita

    VST 3 je nově pod licencí MIT. S verzí 3.8.0 proběhlo přelicencování zdrojových kódů z licencí "Proprietary Steinberg VST3 License" a "General Public License (GPL) Version 3". VST (Virtual Studio Technology, Wikipedie) je softwarové rozhraní pro komunikaci mezi hostitelským programem a zásuvnými moduly (pluginy), kde tyto moduly slouží ke generování a úpravě digitálního audio signálu.

    Ladislav Hagara | Komentářů: 1
    24.10. 03:22 | Nová verze

    Open source 3D herní a simulační engine Open 3D Engine (O3DE) byl vydán v nové verzi 25.10. Podrobný přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    23.10. 20:11 | Komunita

    V Londýně probíhá dvoudenní Ubuntu Summit 25.10. Na programu je řada zajímavých přednášek. Zhlédnout je lze také na YouTube (23. 10. a 24. 10.).

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (36%)
     (48%)
     (20%)
     (19%)
     (23%)
     (17%)
     (21%)
     (17%)
     (18%)
    Celkem 277 hlasů
     Komentářů: 14, poslední 14.10. 09:04
    Rozcestník

    Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý

    28.9.2006 12:59 | Přečteno: 5684× | Výběrový blog | poslední úprava: 15.4.2007 16:17

    Po téměř úplném přechodu na Linux přibližně před rokem jsem přestal používat OCR jelikož jsem na to nenašel žádný použitelný software pro Linux zdarma. Nic z toho co jsem zkoušel nefungovalo. Google nedávno informoval o uvolnění OCR engine Tesseract pod licencí Apache 2.0. Dnešní článek na Newsforge mi to připomněl, tak jsem se rozhodl Tesseract vyzkoušet. Zdrojový kód je ke stažení ze Sourceforge. Kompilace a instalace je snadná a rychlá (Ubuntu 6.06): $ ./configure; make; sudo checkinstall -D. Tesseract však poté nefunguje. Je ještě třeba dát adresář tessdata/ do /usr/local/bin/.

    Dal jsem Tesseractu přečíst stránku jednoho článku ve formátu tiff ($ tesseract test.tif test). Ta jedna stránka má 17 MB (scan z kopírky v knihovně) a Tesseract ji přečetl skoro hned. Existuje i skript na převod souborů pro Tesseract. Vzniklý soubor test.txt je minimálně stejně dobrý jako výstupy z různých programů co jsem používal ve Windows (nepamatuju kterých, prostě nějaký shareware). Je tam pár chyb, ale jsem mile překvapen. Zdá se že znovu začnu využívat OCR.

    
    

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    28.9.2006 13:29 medulin | skóre: 31 | blog: medulin | ČR
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    A jak je na tom z českými znaky?
    stativ avatar 28.9.2006 13:53 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Staci si precist ten clanek na linux.com- podpora pro jine nez us-ascii znaky neni.
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    28.9.2006 13:54 frdrx | skóre: 29 | blog: frdrx
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Sám jsem na to nepomyslel, protože s češtinou skoro nedělám. Teď jsem to zkusil a, jak jsem očekával, je to špatný. Český znaky zatím nezná.
    Patička mi slouží k tomu, abych si lépe poznal svoje příspěvky.
    28.9.2006 14:02 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Pridej ho prosim do katalogu software ..
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    28.9.2006 14:27 miso | skóre: 36 | blog: iSCSI_initiator_howto | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Hura, konecne!
    z toho katalogu mam radost ;-)
    Project Satan infects Calculon with Werecar virus
    28.9.2006 15:29 Kyosuke | skóre: 28 | blog: nalady_v_modre
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Hihihi … :-D Těší mně, jmenuju se Google … :-D
    28.9.2006 19:47 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Pane Google, proč je Google Web Toolkit zrovna v Javě? :-D
    When your hammer is C++, everything begins to look like a thumb.
    28.9.2006 22:26 Kyosuke | skóre: 28 | blog: nalady_v_modre
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    To já nevím, jak je vidět, dělám jim jen tiskového mluvčího … :-D (Něco jako Ústa Sauronova? :-))
    28.9.2006 18:41 pasmen | skóre: 45 | blog: glob | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Me by spis zajimalo, jestli by nekdo nevedel o nejakem software pro linux (at uz placeny nebo free, free radsi :) ktery by umel cist carove kody z naskenovanych dokumentu. Neco jako nemecky DocumentAssembler.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.