abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 04:00 | Zajímavý software

    Open source reimplementace počítačových her Tomb Raider I a Tomb Raider II spolu s dalšími vylepšeními a opravami chyb TRX byla vydána ve verzi 1.0. Jedná se o sloučení projektů / enginů TR1X a TR2X do jednoho TRX. Videoukázka na YouTube.

    Ladislav Hagara | Komentářů: 0
    včera 17:00 | IT novinky

    Společnost Seznam.cz spouští konverzační nástroj založený na umělé inteligenci Seznam Asistent. Asistent využívá vlastní jazykový model SeLLMa a dočasně i komerční modely od OpenAI provozované v evropských datacentrech prostřednictvím Microsoft Azure. Dlouhodobým cílem Seznamu je provozovat Asistenta výhradně na interních jazykových modelech a ve vlastních datových centrech.

    Ladislav Hagara | Komentářů: 3
    včera 11:55 | Zajímavý software

    Software LibrePods osvobozuje bezdrátová sluchátka AirPods z ekosystému Applu. Exkluzivní funkce AirPods umožňuje využívat na Androidu a Linuxu. Díky zdokumentování proprietárního protokolu AAP (Apple Accessory Protocol).

    Ladislav Hagara | Komentářů: 0
    včera 05:00 | Nová verze

    Byl vydán AlmaLinux OS 10.1 s kódovým názvem Heliotrope Lion. S podporou Btrfs. Podrobnosti v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 04:33 | Komunita

    Placená služba prohledávání zprostředkovatelů dat a automatického odstraňování uniklých osobních údajů Mozilla Monitor Plus bude 17. prosince ukončena. Bezplatná monitorovací služba Mozilla Monitor bude i nadále poskytovat okamžitá upozornění a podrobné pokyny k omezení rizik úniku dat. Služba Mozilla Monitor Plus byla představena v únoru loňského roku.

    Ladislav Hagara | Komentářů: 0
    24.11. 22:44 | Nová verze

    Waydroid (Wikipedie, GitHub) byl vydán v nové verzi 1.6.0. Waydroid umožňuje spouštět aplikace pro Android na běžných linuxových distribucích. Běhové prostředí vychází z LineageOS.

    Ladislav Hagara | Komentářů: 3
    24.11. 15:44 | Nová verze

    Příspěvek na blogu Raspberry Pi představuje novou kompletně přepracovanou verzi 2.0 aplikace Raspberry Pi Imager (YouTube) pro stažení, nakonfigurování a zapsání obrazu operačního systému pro Raspberry Pi na SD kartu. Z novinek lze vypíchnout volitelnou konfiguraci Raspberry Pi Connect.

    Ladislav Hagara | Komentářů: 3
    24.11. 11:22 | Nová verze

    Memtest86+ (Wikipedie), svobodný nástroj pro kontrolu operační paměti, byl vydán ve verzi 8.00. Přináší podporu nejnovějších procesorů Intel a AMD nebo také tmavý režim.

    Ladislav Hagara | Komentářů: 0
    24.11. 10:55 | Nová verze

    Programovací jazyk Racket (Wikipedie), tj. jazyk z rodiny jazyků Lisp a potomek jazyka Scheme, byl vydán v nové major verzi 9.0. Hlavní novinku jsou paralelní vlákna (Parallel Threads).

    Ladislav Hagara | Komentářů: 0
    24.11. 10:11 | Komunita

    Před šesti týdny bylo oznámeno, že Qualcomm kupuje Arduino. Minulý týden byly na stránkách Arduina aktualizovány podmínky používání a zásady ochrany osobních údajů. Objevily se obavy, že by otevřená povaha Arduina mohla být ohrožena. Arduino ubezpečuje, že se nic nemění a například omezení reverzního inženýrství v podmínkách používání se týká pouze SaaS cloudové aplikace.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (46%)
     (19%)
     (18%)
     (22%)
     (15%)
     (23%)
     (16%)
     (17%)
    Celkem 400 hlasů
     Komentářů: 17, poslední 19.11. 21:57
    Rozcestník

    Dotaz: Ocr v Linuxu

    13.5.2013 13:42 Jack Hokus | skóre: 34 | blog: LostHeaven
    Ocr v Linuxu
    Přečteno: 1141×
    Ahoj,

    pokouším se extrahovat text ze souboru pomocí programu Gocr. Program spouštím z konzole s těmito paramtry [petr@localhost Plocha]$ gocr -f HTML -i meditace.jpg -o meditace.txt.

    Výstupní soubor se sice vytvoří, ale zůstane prázdný. Zatím se mi nepovedlo najít řešení tohoto problému. Budu vděčný za jakoukoli relevantní odpověď

    Petr

    PS: Základní návod jsem našel zde.
    http://www.jackhokus.cz/

    Odpovědi

    stativ avatar 13.5.2013 13:51 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Začal bych tím, že bych použil Tesseract místo GOCR (kdykoliv jsem zkoušel GOCR, tak výsledky nebyly zrovna přesvědčivé).
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    14.5.2013 09:30 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    zkusil jsem tesseract. Na poprvé to nedopadlo moc dobře. Po zadání příkazu ve tvaru tesseract test.jpg out -l ces jsem dostal hlášku o neoprávněném přístupu do paměti. Google mi hodil odkaz na bugzillu, kde jsem našel hodně podobnou chybu.

    Nakonec byl problém na mé straně. Bylo třeba doinstalovat balíček pro češtinu yum install tesseract-langpack-ces.noarch a pády ustaly.

    Nicméně, výstupní text je stále nečitelný, problém dělají znaky s diaktitikou. Zkusím ještě potrápit strejdu Googla, nicméně budu věčný za jakoukoli radu.

    Petr
    http://www.jackhokus.cz/
    14.5.2013 10:14 ikar
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Jak vypadá ten test.jpg? Pro OCR je kvalita skenu docela podstatná...
    stativ avatar 14.5.2013 12:32 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Tesseract má (měl?) navíc takovou divnou vlastnost, že výsledky rozpoznávání závisí i na tom, jestli byl obrázek uložen ve stupních šedi nebo barevně.
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    15.5.2013 10:19 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    včera jsem s úspěchem zkusil Cuneiform. Dnes se ke stroji na kterém to řeším nedostanu, ale zítra zkusím dodat nějaké podrobnosti.

    Petr
    http://www.jackhokus.cz/
    15.5.2013 11:32 martin
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Používám gui pro Cuneiform i Tesseract Yagf k úplné spokojenosti. Ke skenování dokumentů VueScan.
    20.5.2013 11:53 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    díky za typ, yagf funguje znamenitě

    Petr
    http://www.jackhokus.cz/
    20.5.2013 19:50 dep
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Existuje v Linuxu nejaka moznost jak vytvaret prohledavatelne pdf? (Tj. provest OCR na obrazky ulozene v pdf a vysledek ulozit do tohoto pdf a propojit se souradnicemi v obrazku)
    21.5.2013 11:53 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    nejsem si jistý, zda jsem dobře porozuměl tomu co potřebujete, zkuste to trochu rozvést. Pokud Vám jde o vyhledání nějakého řetězce v textu, tak pdf dokumenty vytvořené v LaTeXu to zvládnou. Jestli potřebujete něco jiného, zkuste doplnit dotaz

    Petr
    http://www.jackhokus.cz/
    21.5.2013 12:36 dustin | skóre: 63 | blog: dustin
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Jde mu o doplnění OCRkovaného textu do naskenovaných obrázků. PDF to podporuje a některé OCR softy umí.
    21.5.2013 22:42 hacup | skóre: 8
    Rozbalit Rozbalit vše Re: Ocr v Linuxu

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.