abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 16:22 | IT novinky

    Internetový prohlížeč Ladybird ohlásil tranzici z programovacího jazyka C++ do Rustu. Přechod bude probíhat postupně a nové komponenty budou dočasně koexistovat se stávajícím C++ kódem. Pro urychlení práce bude použita umělá inteligence, při portování první komponenty prohlížeče, JavaScriptového enginu LibJS, bylo během dvou týdnů pomocí nástrojů Claude Code a Codex vygenerováno kolem 25 000 řádků kódu. Nejedná se o čistě autonomní vývoj pomocí agentů.

    NUKE GAZA! 🎆 | Komentářů: 2
    dnes 15:55 | Nová verze

    Byl vydán Mozilla Firefox 148.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Nově lze snadno povolit nebo zakázat jednotlivé AI funkce. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 148 bude brzy k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 2
    dnes 12:44 | Nová verze

    Byla vydána nová verze 22.1.0, tj. první stabilní verze z nové řady 22.1.x, překladačové infrastruktury LLVM (Wikipedie). Přehled novinek v poznámkách k vydání: LLVM, Clang, LLD, Extra Clang Tools a Libc++.

    Ladislav Hagara | Komentářů: 0
    dnes 12:22 | Humor

    X86CSS je experimentální webový emulátor instrukční sady x86 napsaný výhradně v CSS, tedy bez JavaScriptu nebo dalších dynamických prvků. Stránka 'spouští' assemblerovový program mikroprocesoru 8086 a názorně tak demonstruje, že i prosté CSS může fungovat jako Turingovsky kompletní jazyk. Zdrojový kód projektu je na GitHubu.

    NUKE GAZA! 🎆 | Komentářů: 3
    dnes 12:11 | Nová verze

    Po šesti letech byla vydána nová verze 1.3 webového rozhraní ke gitovým repozitářům CGit.

    Ladislav Hagara | Komentářů: 0
    dnes 02:33 | Nová verze

    Byla vydána nová verze 6.1 linuxové distribuce Lakka (Wikipedie), jež umožňuje transformovat podporované počítače v herní konzole. Nejnovější Lakka přichází s RetroArchem 1.22.2.

    Ladislav Hagara | Komentářů: 0
    dnes 02:11 | Nová verze

    Matematický software GNU Octave byl vydán ve verzi 11.1.0. Podrobnosti v poznámkách k vydání. Vedle menších změn rozhraní jsou jako obvykle zahrnuta také výkonnostní vylepšení a zlepšení kompatibility s Matlabem.

    |🇵🇸 | Komentářů: 1
    včera 21:44 | Nová verze

    Weston, referenční implementace kompozitoru pro Wayland, byl vydán ve verzi 15.0.0. Přehled novinek v příspěvku na blogu společnosti Collabora. Vypíchnout lze Lua shell umožňující psát správu oken v jazyce Lua.

    Ladislav Hagara | Komentářů: 0
    včera 21:11 | Nová verze

    Organizace Apache Software Foundation (ASF) vydala verzi 29 integrovaného vývojového prostředí a vývojové platformy napsané v Javě NetBeans (Wikipedie). Přehled novinek na GitHubu. Instalovat lze také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 3
    včera 18:22 | IT novinky

    Ústavní soud na svých webových stránkách i v databázi NALUS (NÁLezy a USnesení Ústavního soudu) představil novou verzi chatbota využívajícího umělou inteligenci. Jeho posláním je usnadnit veřejnosti orientaci v rozsáhlé judikatuře Ústavního soudu a pomoci jí s vyhledáváním informací i na webových stránkách soudu, a to i v jiných jazycích. Jde o první nasazení umělé inteligence v rámci webových stránek a databází judikatury českých soudů.

    Ladislav Hagara | Komentářů: 17
    Které desktopové prostředí na Linuxu používáte?
     (18%)
     (6%)
     (0%)
     (11%)
     (27%)
     (2%)
     (5%)
     (1%)
     (12%)
     (26%)
    Celkem 953 hlasů
     Komentářů: 25, poslední 3.2. 19:50
    Rozcestník

    Dotaz: Ocr v Linuxu

    13.5.2013 13:42 Jack Hokus | skóre: 34 | blog: LostHeaven
    Ocr v Linuxu
    Přečteno: 1162×
    Ahoj,

    pokouším se extrahovat text ze souboru pomocí programu Gocr. Program spouštím z konzole s těmito paramtry [petr@localhost Plocha]$ gocr -f HTML -i meditace.jpg -o meditace.txt.

    Výstupní soubor se sice vytvoří, ale zůstane prázdný. Zatím se mi nepovedlo najít řešení tohoto problému. Budu vděčný za jakoukoli relevantní odpověď

    Petr

    PS: Základní návod jsem našel zde.
    http://www.jackhokus.cz/

    Odpovědi

    stativ avatar 13.5.2013 13:51 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Začal bych tím, že bych použil Tesseract místo GOCR (kdykoliv jsem zkoušel GOCR, tak výsledky nebyly zrovna přesvědčivé).
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    14.5.2013 09:30 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    zkusil jsem tesseract. Na poprvé to nedopadlo moc dobře. Po zadání příkazu ve tvaru tesseract test.jpg out -l ces jsem dostal hlášku o neoprávněném přístupu do paměti. Google mi hodil odkaz na bugzillu, kde jsem našel hodně podobnou chybu.

    Nakonec byl problém na mé straně. Bylo třeba doinstalovat balíček pro češtinu yum install tesseract-langpack-ces.noarch a pády ustaly.

    Nicméně, výstupní text je stále nečitelný, problém dělají znaky s diaktitikou. Zkusím ještě potrápit strejdu Googla, nicméně budu věčný za jakoukoli radu.

    Petr
    http://www.jackhokus.cz/
    14.5.2013 10:14 ikar
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Jak vypadá ten test.jpg? Pro OCR je kvalita skenu docela podstatná...
    stativ avatar 14.5.2013 12:32 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Tesseract má (měl?) navíc takovou divnou vlastnost, že výsledky rozpoznávání závisí i na tom, jestli byl obrázek uložen ve stupních šedi nebo barevně.
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    15.5.2013 10:19 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    včera jsem s úspěchem zkusil Cuneiform. Dnes se ke stroji na kterém to řeším nedostanu, ale zítra zkusím dodat nějaké podrobnosti.

    Petr
    http://www.jackhokus.cz/
    15.5.2013 11:32 martin
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Používám gui pro Cuneiform i Tesseract Yagf k úplné spokojenosti. Ke skenování dokumentů VueScan.
    20.5.2013 11:53 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    díky za typ, yagf funguje znamenitě

    Petr
    http://www.jackhokus.cz/
    20.5.2013 19:50 dep
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Existuje v Linuxu nejaka moznost jak vytvaret prohledavatelne pdf? (Tj. provest OCR na obrazky ulozene v pdf a vysledek ulozit do tohoto pdf a propojit se souradnicemi v obrazku)
    21.5.2013 11:53 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    nejsem si jistý, zda jsem dobře porozuměl tomu co potřebujete, zkuste to trochu rozvést. Pokud Vám jde o vyhledání nějakého řetězce v textu, tak pdf dokumenty vytvořené v LaTeXu to zvládnou. Jestli potřebujete něco jiného, zkuste doplnit dotaz

    Petr
    http://www.jackhokus.cz/
    21.5.2013 12:36 dustin | skóre: 63 | blog: dustin
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Jde mu o doplnění OCRkovaného textu do naskenovaných obrázků. PDF to podporuje a některé OCR softy umí.
    21.5.2013 22:42 hacup | skóre: 8
    Rozbalit Rozbalit vše Re: Ocr v Linuxu

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.