abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 13:22 | IT novinky

    Na Kickstarteru běží kampaň na podporu kapesního počítače s Linuxem CardputerZero od společnosti M5Stack. Postaven je na Raspberry Pi Compute Module 0. Podporuje moduly M5. Koupit lze s rozšířeními LoRa a CC1101.

    Ladislav Hagara | Komentářů: 0
    dnes 11:11 | Pozvánky

    Tento týden se bude vyznačovat zejména deštěm, a proto vás může zajímat, že již v úterý proběhne 63. Virtuální Bastlírna, která se bude odehrávat přímo v teple vašich domovů a bastlíren. Proto se připojte k této volné otevřené diskuzi bastlířů, techniků, vědců, ve které se probírají novinky a zajímavá témata z techniky. Mezi největší novinky bude tentokrát patrně patřit oznámení hackerského nástroje Flipper One. Zároveň úspěšně probíhá

    … více »
    bkralik | Komentářů: 0
    dnes 03:22 | Nová verze

    86Box (Wikipedie), tj. emulátor retro počítačů založených na x86, byl vydán ve verzi 6.0. Přibyly například zvuky pevného disku. Na GitHubu jsou vedle zdrojových kódů ke stažení také připravené balíčky ve formátu AppImage.

    Ladislav Hagara | Komentářů: 0
    dnes 03:00 | Nová verze

    Byla vydána nová verze 4.6 audio přehrávače Audacious (Wikipedie). Z novinek lze vypíchnout nový plugin pro procházení soubory, podporu audio formátu Musepack SV8 nebo přechod na build systém Meson.

    Ladislav Hagara | Komentářů: 0
    včera 15:55 | Nová verze

    Alliance for Open Media vydala verzi 1.0.0 specifikace svobodného videoformátu AV2. Jean-Baptiste Kempf, prezident neziskové organizace VideoLAN stojící za svobodným multiplatformním multimediálním přehrávačem a frameworkem VLC, představil na svém blogu dekodér AV2 s názvem dav2d.

    Ladislav Hagara | Komentářů: 0
    včera 15:00 | Nová verze

    V aktuálním přehledu vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie) bylo oznámeno vydání nové verze 0.2.0.

    Ladislav Hagara | Komentářů: 0
    včera 14:33 | Nová verze

    Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu optimalizovaná pro jednodeskové počítače na platformě ARM a RISC-V, ke stažení ale také pro Intel a AMD, byl vydán ve verzi 26.5.1. Přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 0
    včera 14:11 | Nová verze

    Byla vydána nová stabilní verze 26.05 linuxové distribuce NixOS (Wikipedie). Její kódové označení je Yarara. Podrobný přehled novinek v poznámkách k vydání. O balíčky se v NixOS stará správce balíčků Nix.

    Ladislav Hagara | Komentářů: 0
    29.5. 00:22 | Nová verze

    Byla vydána verze 1.96.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.

    Ladislav Hagara | Komentářů: 2
    28.5. 20:33 | IT novinky

    Společnosti IBM a Red Hat představily Project Lightwell s investicí 5 miliard dolarů. Jedná se o důvěryhodné clearingové centrum pro bezpečnost open source softwaru a zabezpečení dodavatelských řetězců s novým AI modelem a globální skupinou více než 20 000 softwarových inženýrů. Služby centra budou dostupné prostřednictvím komerčních předplatných. Project Lightwell staví na iniciativách jako Anthropic Glasswing nebo OpenAI Trust Access for Cyber.

    Ladislav Hagara | Komentářů: 1
    Které desktopové prostředí na Linuxu používáte?
     (12%)
     (8%)
     (2%)
     (15%)
     (31%)
     (4%)
     (6%)
     (3%)
     (16%)
     (26%)
    Celkem 1788 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: Ocr v Linuxu

    13.5.2013 13:42 Jack Hokus | skóre: 34 | blog: LostHeaven
    Ocr v Linuxu
    Přečteno: 1169×
    Ahoj,

    pokouším se extrahovat text ze souboru pomocí programu Gocr. Program spouštím z konzole s těmito paramtry [petr@localhost Plocha]$ gocr -f HTML -i meditace.jpg -o meditace.txt.

    Výstupní soubor se sice vytvoří, ale zůstane prázdný. Zatím se mi nepovedlo najít řešení tohoto problému. Budu vděčný za jakoukoli relevantní odpověď

    Petr

    PS: Základní návod jsem našel zde.
    http://www.jackhokus.cz/

    Odpovědi

    stativ avatar 13.5.2013 13:51 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Začal bych tím, že bych použil Tesseract místo GOCR (kdykoliv jsem zkoušel GOCR, tak výsledky nebyly zrovna přesvědčivé).
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    14.5.2013 09:30 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    zkusil jsem tesseract. Na poprvé to nedopadlo moc dobře. Po zadání příkazu ve tvaru tesseract test.jpg out -l ces jsem dostal hlášku o neoprávněném přístupu do paměti. Google mi hodil odkaz na bugzillu, kde jsem našel hodně podobnou chybu.

    Nakonec byl problém na mé straně. Bylo třeba doinstalovat balíček pro češtinu yum install tesseract-langpack-ces.noarch a pády ustaly.

    Nicméně, výstupní text je stále nečitelný, problém dělají znaky s diaktitikou. Zkusím ještě potrápit strejdu Googla, nicméně budu věčný za jakoukoli radu.

    Petr
    http://www.jackhokus.cz/
    14.5.2013 10:14 ikar
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Jak vypadá ten test.jpg? Pro OCR je kvalita skenu docela podstatná...
    stativ avatar 14.5.2013 12:32 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Tesseract má (měl?) navíc takovou divnou vlastnost, že výsledky rozpoznávání závisí i na tom, jestli byl obrázek uložen ve stupních šedi nebo barevně.
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    15.5.2013 10:19 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    včera jsem s úspěchem zkusil Cuneiform. Dnes se ke stroji na kterém to řeším nedostanu, ale zítra zkusím dodat nějaké podrobnosti.

    Petr
    http://www.jackhokus.cz/
    15.5.2013 11:32 martin
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Používám gui pro Cuneiform i Tesseract Yagf k úplné spokojenosti. Ke skenování dokumentů VueScan.
    20.5.2013 11:53 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    díky za typ, yagf funguje znamenitě

    Petr
    http://www.jackhokus.cz/
    20.5.2013 19:50 dep
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Existuje v Linuxu nejaka moznost jak vytvaret prohledavatelne pdf? (Tj. provest OCR na obrazky ulozene v pdf a vysledek ulozit do tohoto pdf a propojit se souradnicemi v obrazku)
    21.5.2013 11:53 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    nejsem si jistý, zda jsem dobře porozuměl tomu co potřebujete, zkuste to trochu rozvést. Pokud Vám jde o vyhledání nějakého řetězce v textu, tak pdf dokumenty vytvořené v LaTeXu to zvládnou. Jestli potřebujete něco jiného, zkuste doplnit dotaz

    Petr
    http://www.jackhokus.cz/
    21.5.2013 12:36 dustin | skóre: 63 | blog: dustin
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Jde mu o doplnění OCRkovaného textu do naskenovaných obrázků. PDF to podporuje a některé OCR softy umí.
    21.5.2013 22:42 hacup | skóre: 8
    Rozbalit Rozbalit vše Re: Ocr v Linuxu

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.