abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 19:33 | Nová verze

    Vývojáři OpenMW (Wikipedie) oznámili vydání verze 0.49.0 této svobodné implementace enginu pro hru The Elder Scrolls III: Morrowind. Přehled novinek i s náhledy obrazovek v oznámení o vydání.

    Ladislav Hagara | Komentářů: 1
    včera 15:22 | IT novinky

    Masivní výpadek elektrického proudu zasáhl velkou část České republiky. Hasiči vyjížděli k většímu počtu lidí uvězněných ve výtazích. Výpadek se týkal zejména severozápadu republiky, dotkl se také Prahy, Středočeského nebo Královéhradeckého kraje. Ochromen byl provoz pražské MHD, linky metra se už podařilo obnovit. Výpadek proudu postihl osm rozvoden přenosové soustavy, pět z nich je nyní opět v provozu. Příčina problémů je však stále neznámá. Po 16. hodině zasedne Ústřední krizový štáb.

    Ladislav Hagara | Komentářů: 23
    včera 02:33 | Nová verze

    Po více než roce vývoje od vydání verze 5.40 byla vydána nová stabilní verze 5.42 programovacího jazyka Perl (Wikipedie). Do vývoje se zapojilo 64 vývojářů. Změněno bylo přibližně 280 tisíc řádků v 1 500 souborech. Přehled novinek a změn v podrobném seznamu.

    Ladislav Hagara | Komentářů: 4
    včera 01:33 | Nová verze

    Byla vydána nová stabilní verze 7.5 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 138. Přehled novinek i s náhledy v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    3.7. 16:33 | Zajímavý software

    Sniffnet je multiplatformní aplikace pro sledování internetového provozu. Ke stažení pro Windows, macOS i Linux. Jedná se o open source software. Zdrojové kódy v programovacím jazyce Rust jsou k dispozici na GitHubu. Vývoj je finančně podporován NLnet Foundation.

    Ladislav Hagara | Komentářů: 0
    3.7. 12:33 | Nová verze

    Byl vydán Debian Installer Trixie RC 2, tj. druhá RC verze instalátoru Debianu 13 s kódovým názvem Trixie.

    Ladislav Hagara | Komentářů: 0
    3.7. 03:33 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za červen (YouTube).

    Ladislav Hagara | Komentářů: 0
    3.7. 02:33 | Nová verze

    Libreboot (Wikipedie) – svobodný firmware nahrazující proprietární BIOSy, distribuce Corebootu s pravidly pro proprietární bloby – byl vydán ve verzi 25.06 "Luminous Lemon". Přidána byla podpora desek Acer Q45T-AM a Dell Precision T1700 SFF a MT. Současně byl ve verzi 25.06 "Onerous Olive" vydán také Canoeboot, tj. fork Librebootu s ještě přísnějšími pravidly.

    Ladislav Hagara | Komentářů: 0
    3.7. 01:33 | Komunita

    Licence GNU GPLv3 o víkendu oslavila 18 let. Oficiálně vyšla 29. června 2007. Při té příležitosti Richard E. Fontana a Bradley M. Kuhn restartovali, oživili a znovu spustili projekt Copyleft-Next s cílem prodiskutovat a navrhnout novou licenci.

    Ladislav Hagara | Komentářů: 0
    2.7. 16:55 | Nová verze

    Svobodný nemocniční informační systém GNU Health Hospital Information System (HIS) (Wikipedie) byl vydán ve verzi 5.0 (Mastodon).

    Ladislav Hagara | Komentářů: 0
    Jaký je váš oblíbený skriptovací jazyk?
     (59%)
     (27%)
     (7%)
     (2%)
     (0%)
     (1%)
     (3%)
    Celkem 353 hlasů
     Komentářů: 16, poslední 8.6. 21:05
    Rozcestník

    Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý

    28.9.2006 12:59 | Přečteno: 5655× | Výběrový blog | poslední úprava: 15.4.2007 16:17

    Po téměř úplném přechodu na Linux přibližně před rokem jsem přestal používat OCR jelikož jsem na to nenašel žádný použitelný software pro Linux zdarma. Nic z toho co jsem zkoušel nefungovalo. Google nedávno informoval o uvolnění OCR engine Tesseract pod licencí Apache 2.0. Dnešní článek na Newsforge mi to připomněl, tak jsem se rozhodl Tesseract vyzkoušet. Zdrojový kód je ke stažení ze Sourceforge. Kompilace a instalace je snadná a rychlá (Ubuntu 6.06): $ ./configure; make; sudo checkinstall -D. Tesseract však poté nefunguje. Je ještě třeba dát adresář tessdata/ do /usr/local/bin/.

    Dal jsem Tesseractu přečíst stránku jednoho článku ve formátu tiff ($ tesseract test.tif test). Ta jedna stránka má 17 MB (scan z kopírky v knihovně) a Tesseract ji přečetl skoro hned. Existuje i skript na převod souborů pro Tesseract. Vzniklý soubor test.txt je minimálně stejně dobrý jako výstupy z různých programů co jsem používal ve Windows (nepamatuju kterých, prostě nějaký shareware). Je tam pár chyb, ale jsem mile překvapen. Zdá se že znovu začnu využívat OCR.

    
    

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    28.9.2006 13:29 medulin | skóre: 31 | blog: medulin | ČR
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    A jak je na tom z českými znaky?
    stativ avatar 28.9.2006 13:53 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Staci si precist ten clanek na linux.com- podpora pro jine nez us-ascii znaky neni.
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    28.9.2006 13:54 frdrx | skóre: 29 | blog: frdrx
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Sám jsem na to nepomyslel, protože s češtinou skoro nedělám. Teď jsem to zkusil a, jak jsem očekával, je to špatný. Český znaky zatím nezná.
    Patička mi slouží k tomu, abych si lépe poznal svoje příspěvky.
    28.9.2006 14:02 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Pridej ho prosim do katalogu software ..
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    28.9.2006 14:27 miso | skóre: 36 | blog: iSCSI_initiator_howto | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Hura, konecne!
    z toho katalogu mam radost ;-)
    Project Satan infects Calculon with Werecar virus
    28.9.2006 15:29 Kyosuke | skóre: 28 | blog: nalady_v_modre
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Hihihi … :-D Těší mně, jmenuju se Google … :-D
    28.9.2006 19:47 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Pane Google, proč je Google Web Toolkit zrovna v Javě? :-D
    When your hammer is C++, everything begins to look like a thumb.
    28.9.2006 22:26 Kyosuke | skóre: 28 | blog: nalady_v_modre
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    To já nevím, jak je vidět, dělám jim jen tiskového mluvčího … :-D (Něco jako Ústa Sauronova? :-))
    28.9.2006 18:41 pasmen | skóre: 45 | blog: glob | Praha
    Rozbalit Rozbalit vše Re: Tesseract 1.01. Open Source OCR Engine, vyzkoušeno a dobrý
    Me by spis zajimalo, jestli by nekdo nevedel o nejakem software pro linux (at uz placeny nebo free, free radsi :) ktery by umel cist carove kody z naskenovanych dokumentu. Neco jako nemecky DocumentAssembler.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.