abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 21:22 | Zajímavý projekt

    Iconify je seznam a galerie kolekcí vektorových open-source ikon, ke stažení je přes 275000 ikon z více jak dvou set sad. Tento rovněž open-source projekt dává vývojářům k dispozici i API pro snadnou integraci svobodných ikon do jejich projektů.

    NUKE GAZA! 🎆 | Komentářů: 0
    dnes 03:33 | IT novinky

    Dle plánu certifikační autorita Let's Encrypt nově vydává také certifikáty s šestidenní platností (160 hodin) s možností vystavit je na IP adresu.

    Ladislav Hagara | Komentářů: 4
    včera 14:44 | Nová verze

    V programovacím jazyce Go naprogramovaná webová aplikace pro spolupráci na zdrojových kódech pomocí gitu Forgejo byla vydána ve verzi 14.0 (Mastodon). Forgejo je fork Gitei.

    Ladislav Hagara | Komentářů: 2
    včera 13:11 | Zajímavý projekt

    Just the Browser je projekt, 'který vám pomůže v internetovém prohlížeči deaktivovat funkce umělé inteligence, telemetrii, sponzorovaný obsah, integraci produktů a další nepříjemnosti' (repozitář na GitHubu). Využívá k tomu skrytá nastavení ve webových prohlížečích, určená původně pro firmy a organizace ('enterprise policies'). Pod linuxem je skriptem pro automatickou úpravu nastavení prozatím podporován pouze prohlížeč Firefox.

    NUKE GAZA! 🎆 | Komentářů: 3
    16.1. 16:44 | Nová verze

    Svobodný multiplatformní herní engine Bevy napsaný v Rustu byl vydán ve verzi 0.18. Díky 174 přispěvatelům.

    Ladislav Hagara | Komentářů: 2
    16.1. 15:11 | IT novinky

    Miliardy korun na digitalizaci služeb státu nestačily. Stát do ní v letech 2020 až 2024 vložil víc než 50 miliard korun, ale původní cíl se nepodařilo splnit. Od loňského února měly být služby státu plně digitalizované a občané měli mít právo komunikovat se státem digitálně. Do tohoto data se povedlo plně digitalizovat 18 procent agendových služeb státu. Dnes to uvedl Nejvyšší kontrolní úřad (NKÚ) v souhrnné zprávě o stavu digitalizace v Česku. Zpráva vychází z výsledků víc než 50 kontrol, které NKÚ v posledních pěti letech v tomto oboru uskutečnil.

    Ladislav Hagara | Komentářů: 25
    16.1. 13:55 | IT novinky

    Nadace Wikimedia, která je provozovatelem internetové encyklopedie Wikipedia, oznámila u příležitosti 25. výročí vzniku encyklopedie nové licenční dohody s firmami vyvíjejícími umělou inteligenci (AI). Mezi partnery encyklopedie tak nově patří Microsoft, Amazon a Meta Platforms, ale také start-up Perplexity a francouzská společnost Mistral AI. Wikimedia má podobnou dohodu od roku 2022 také se společností Google ze skupiny

    … více »
    Ladislav Hagara | Komentářů: 0
    16.1. 02:22 | Nová verze

    D7VK byl vydán ve verzi 1.2. Jedná se o fork DXVK implementující překlad volání Direct3D 5, 6 a 7 na Vulkan. DXVK zvládá Direct3D 8, 9, 10 a 11.

    Ladislav Hagara | Komentářů: 0
    16.1. 02:00 | Nová verze

    Byla vydána verze 12.0.0 knihovny libvirt (Wikipedie) zastřešující různé virtualizační technologie a vytvářející jednotné rozhraní pro správu virtuálních strojů. Současně byl ve verzi 12.0.0 vydán související modul pro Python libvirt-python. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    15.1. 19:22 | Humor

    CreepyLink.com je nový zkracovač URL adres, 'díky kterému budou vaše odkazy vypadat tak podezřele, jak je to jen možné'. Například odkaz na abclinuxu.cz tento zkracovač převádí do podoby 'https://netflix.web-safe.link/logger_8oIlgs_free_money.php'. Dle prohlášení autora je CreepyLink alternativou ke zkracovači ShadyURL (repozitář na githubu), který dnes již bohužel není v provozu.

    NUKE GAZA! 🎆 | Komentářů: 3
    Které desktopové prostředí na Linuxu používáte?
     (16%)
     (5%)
     (0%)
     (9%)
     (19%)
     (3%)
     (6%)
     (2%)
     (11%)
     (40%)
    Celkem 499 hlasů
     Komentářů: 14, poslední dnes 10:22
    Rozcestník

    Dotaz: Ocr v Linuxu

    13.5.2013 13:42 Jack Hokus | skóre: 34 | blog: LostHeaven
    Ocr v Linuxu
    Přečteno: 1162×
    Ahoj,

    pokouším se extrahovat text ze souboru pomocí programu Gocr. Program spouštím z konzole s těmito paramtry [petr@localhost Plocha]$ gocr -f HTML -i meditace.jpg -o meditace.txt.

    Výstupní soubor se sice vytvoří, ale zůstane prázdný. Zatím se mi nepovedlo najít řešení tohoto problému. Budu vděčný za jakoukoli relevantní odpověď

    Petr

    PS: Základní návod jsem našel zde.
    http://www.jackhokus.cz/

    Odpovědi

    stativ avatar 13.5.2013 13:51 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Začal bych tím, že bych použil Tesseract místo GOCR (kdykoliv jsem zkoušel GOCR, tak výsledky nebyly zrovna přesvědčivé).
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    14.5.2013 09:30 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    zkusil jsem tesseract. Na poprvé to nedopadlo moc dobře. Po zadání příkazu ve tvaru tesseract test.jpg out -l ces jsem dostal hlášku o neoprávněném přístupu do paměti. Google mi hodil odkaz na bugzillu, kde jsem našel hodně podobnou chybu.

    Nakonec byl problém na mé straně. Bylo třeba doinstalovat balíček pro češtinu yum install tesseract-langpack-ces.noarch a pády ustaly.

    Nicméně, výstupní text je stále nečitelný, problém dělají znaky s diaktitikou. Zkusím ještě potrápit strejdu Googla, nicméně budu věčný za jakoukoli radu.

    Petr
    http://www.jackhokus.cz/
    14.5.2013 10:14 ikar
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Jak vypadá ten test.jpg? Pro OCR je kvalita skenu docela podstatná...
    stativ avatar 14.5.2013 12:32 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Tesseract má (měl?) navíc takovou divnou vlastnost, že výsledky rozpoznávání závisí i na tom, jestli byl obrázek uložen ve stupních šedi nebo barevně.
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    15.5.2013 10:19 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    včera jsem s úspěchem zkusil Cuneiform. Dnes se ke stroji na kterém to řeším nedostanu, ale zítra zkusím dodat nějaké podrobnosti.

    Petr
    http://www.jackhokus.cz/
    15.5.2013 11:32 martin
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Používám gui pro Cuneiform i Tesseract Yagf k úplné spokojenosti. Ke skenování dokumentů VueScan.
    20.5.2013 11:53 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    díky za typ, yagf funguje znamenitě

    Petr
    http://www.jackhokus.cz/
    20.5.2013 19:50 dep
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Existuje v Linuxu nejaka moznost jak vytvaret prohledavatelne pdf? (Tj. provest OCR na obrazky ulozene v pdf a vysledek ulozit do tohoto pdf a propojit se souradnicemi v obrazku)
    21.5.2013 11:53 Jack Hokus | skóre: 34 | blog: LostHeaven
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Dobrý den,

    nejsem si jistý, zda jsem dobře porozuměl tomu co potřebujete, zkuste to trochu rozvést. Pokud Vám jde o vyhledání nějakého řetězce v textu, tak pdf dokumenty vytvořené v LaTeXu to zvládnou. Jestli potřebujete něco jiného, zkuste doplnit dotaz

    Petr
    http://www.jackhokus.cz/
    21.5.2013 12:36 dustin | skóre: 63 | blog: dustin
    Rozbalit Rozbalit vše Re: Ocr v Linuxu
    Jde mu o doplnění OCRkovaného textu do naskenovaných obrázků. PDF to podporuje a některé OCR softy umí.
    21.5.2013 22:42 hacup | skóre: 8
    Rozbalit Rozbalit vše Re: Ocr v Linuxu

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.