abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 23:22 | Humor

    Jihokorejská Národní daňová služba (NTS) zabavila kryptoměnu Pre-retogeum (PRTG) v hodnotě 5,6 milionu dolarů. Pochlubila se v tiskové zprávě, do které vložila fotografii zabavených USB flash disků s kryptoměnovými peněženkami spolu se souvisejícími ručně napsanými mnemotechnickými obnovovacími frázemi. Krátce na to byla kryptoměna v hodnotě 4,8 milionu dolarů odcizena. O několik hodin ale vrácena, jelikož PRTG je extrémně nelikvidní, s denním objemem obchodování kolem 332 dolarů a zalistováním na jediné burze, MEXC [Bitcoin.com].

    Ladislav Hagara | Komentářů: 4
    včera 16:33 | Nová verze

    Komunita kolem Linuxu From Scratch (LFS) vydala nové verze knih s návody na instalaci vlastního linuxového systému ze zdrojových kódů Linux From Scratch 13.0 a Beyond Linux From Scratch 13.0. Pouze se systemd.

    Ladislav Hagara | Komentářů: 1
    včera 16:00 | Nová verze

    Byla vydána nová stabilní major verze 25.12 linuxové distribuce primárně určené pro routery a vestavěné systémy OpenWrt (Wikipedie). Jedná se o nástupce předchozí major verze 24.10. Přehled novinek v poznámkách k vydání. Podporováno je více než 2200 zařízení.

    Ladislav Hagara | Komentářů: 0
    včera 04:44 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za únor (YouTube). Odstraněn byl veškerý kód napsaný ve Swiftu. JavaScriptový engine LibJS byl reimplementován v Rustu.

    Ladislav Hagara | Komentářů: 0
    5.3. 21:11 | Nová verze

    Byla vydána verze 1.94.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example. Zveřejněny byly výsledky průzkumu mezi vývojáři v programovacím jazyce Rust: 2025 State of Rust Survey Results.

    Ladislav Hagara | Komentářů: 7
    5.3. 17:33 | Komunita

    Google zveřejnil seznam 185 organizací přijatých do letošního Google Summer of Code (GSoC). Dle plánu se zájemci přihlašují od 16. do 31. března. Vydělat si mohou od 750 do 6600 dolarů. V Česku a na Slovensku je to 900 dolarů za malý, 1800 dolarů za střední a 3600 dolarů za velký projekt. Další informace v často kladených otázkách (FAQ). K dispozici jsou také statistiky z minulých let.

    Ladislav Hagara | Komentářů: 0
    4.3. 22:55 | Nová verze

    Byla vydána únorová aktualizace aneb nová verze 1.110 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.110 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 8
    4.3. 18:11 | IT novinky

    Apple představil 13palcový MacBook Neo s čipem A18 Pro. V základní konfiguraci za 16 990 Kč.

    Ladislav Hagara | Komentářů: 57
    4.3. 12:22 | Komunita

    Kalifornský zákon AB 1043 platný od 1. ledna 2027 vyžaduje, aby operační systémy požadovaly po uživatelích věk nebo datum narození a skrze API poskytovaly aplikacím informaci, zda je uživatel mladší 13 let, má 13 až 16 let, má 16 až 18 let nebo má alespoň 18 let. Vývojáři linuxových distribucí řeší, co s tím (Ubuntu, Fedora, …).

    Ladislav Hagara | Komentářů: 106
    4.3. 11:44 | Pozvánky

    Konference LinuxDays 2026 proběhne o víkendu 3. a 4. října v Praze v areálu ČVUT v Dejvicích na FIT. Čekají vás desítky přednášek, workshopy, stánky a setkání se spoustou chytrých lidí.

    Petr Krčmář | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (17%)
     (7%)
     (0%)
     (11%)
     (28%)
     (2%)
     (5%)
     (2%)
     (13%)
     (25%)
    Celkem 1028 hlasů
     Komentářů: 25, poslední 3.2. 19:50
    Rozcestník

    Linux, OCR a DjVu dokumenty

    3.8.2006 15:20 | Přečteno: 4004× | Za vším hledej Linux | Výběrový blog | poslední úprava: 3.8.2006 15:22

    Není tak dávno co se tady objevila otázka jak je tomu s OCR pod Linuxem. Hrou okolností, jsem se při bádání, jehož výsledkem byly mé poslední příspěvky téma DjVu (Použití DjVu pro skladování elektronické dokumentace a PDF versus DJVU) dostal i k pokusům s OCR.

    O možnosti OCR jsem se začal zajímat už docela dávno, ale první použitelný software pro mne byla Recognita 5.0 pro. Což bylo ještě v éře MS Windows 98. S touto aplikací jsem pak začal dělat své první pokusy pod wine. Bohužel dodnes nepříliš úspěšné - viz níže.

    Recognitu časem schramstnul Omnipage a totálně ji domršil - o čemž jsem se měl možnost přesvědčit po zakoupení Recognita Omnipage pro 14 cz. Někdo to může vidět jinak, ale k mému znechucení přispěl i fakt že se mi ji nepodařilo rozchodit pod wine.

    OCR aplikace pro MS-Windows pod wine

    Své pokusy jsem prováděl pod wine verze 9.18.0:

    ReadIris 10 pro

    Cena: Cena poslední verze ReadIris 11 pro se pohybuje kolem 3 tis. bez DPH (verze corporate 8 tis. bez DPH). Je sice možné stáhnout její demo jenže to je pouze instalátor, který si zbytek dotahá při instalaci, což mi ale pod wine nefunguje.

    Pro testování jsem si tedy schrastil několik různých instalací nižší verze 10 pro. První však měla poškozený instalační balík, což se projevilo až při instalaci. Bylo tedy nutné pozabíjet uvízlé procesy a instalaci zopakovat s jiným. Zcela bez problémů to ani pak nebylo. Před spuštěním si aplikace vyžebrala knihovnu MSVCIRT.dll z MS Windows, ale pak jela celkem v poklidu, až na to, že nezobrazuje obsah oken typu "O programu" a tak. Detail.

    Výsledky OCR enginu v ReadIris mi přišly subjektivně lepší než u následujících aplikací, takže přes poněkud komplikovanou instalaci bych ho upřednostnil, pokud bych už chtěl používat nějaký software vyloženě pro OCR.

    FineReader 8.0 pro

    Cena: Aktuální cena se pohybuje kolem hranice necelých 4 tis. bez DPH (verze corporate 8 tis. bez DPH)

    U instalace pod wine při některých pokusech dobře nefungoval instalační dialog. (Těžko můžete odsouhlasit licenční ujednání, když ho nevidíte a nevidíte ani žádné tlačítko pro potvrzení volby), ale instalace do čistého wine skrze Total Commander proběhla bez nejmenších problémů, což platí i pro verzi 7.0

    FineReader 7.0 pro

    Jsem se pokoušel instalovat především z toho důvodu, že na internetu se vyskytuje utilita, která by měla umět "kuchat" texty do formátu vhodného pro import do DjVu dokumentů přímo z z interních souborů Finereaderu a to verze 5.0 až 7.0. Kdysi jsem Finereader 5.0 pod wine zkoušel a co si vzpomínám, fungoval docela dobře. Bohužel už dávno zmizel v propadlišti času.

    K vyzkoušení výše zmíněné utility jsem se ale nedostal, protože mi výsledek OCR nepřicházel moc uspokojivý, podobně jako u aplikace JRPublisher 2.0. viz níže

    Poznámka: Do verze 7.0 kterou jsem měl k dispozici bylo nutno češtinu doinstalovat.

    Recognita Omnipage 14 cz

    Její instalaci jsem si bohužel musel odpustit, ačkoliv ji máme legálně zakoupenou, nemohu totiž zaboha najít instalačky, a když jsem se ji pokoušel rozběhnout z již jednou instalované staré zálohy, tak ve mě zůstala stejná pachut jako tenkrát, když jsem se to pokoušel pod wine instalovat prvně. Instalace totiž vyžaduje jakousi microsoftí komponentu, bez které končí.

    Cena: Aktuální cena se pohybuje kolem hranice 3 tis. bez DPH (verze full cz stojí 19 tis. bez DPH)

    Poznámka: Navzdory nostalgii vůči Recognitě, jakmile uslyšíte Omnipage berte nohy na ramena. Jsou to vyhozené prachy a dodnes se buším do hlavy že jsem si ten soft vyžebral.

    Recognita 5.0

    Hned úvodem je třeba říct že pod mou instalací wine nefunguje tak jak by měla. Instalace proběhne, aplikace se spustí, pracuje s již vytvořenými rcd dokumenty, ovšem při pokusu o načtení nového obrázku ke zpracování se zhroutí. Pro mé účely to však stačí, mám v rcd dokumentech uloženo několik věcí, které jsem si takto zaarchivoval pro pozdější zpracování.

    OCR engine a aplikace pro zpracování DjVu dokumentů

    Z komerčních aplikací je ke stažení Document Express Enterprise od LizardTechu. Ačkoliv uvádějí že má jít o demo verze 6.0 jde ve skutečnosti o trial verzi 5.1 a pro její aktivaci je nutné sériové číslo, které automaticky posílají e-mailem. LizardTech používá pro OCR engine ReadIris. Můj subjektivní závěr po uskutečněných pokusech je, že má mnohem lepší výsledky než engine z FineReaderu, který používá JRAPublish 2.0. (Testoval jsem i pod Windows XP). Docela mě to zklamalo, protože Document Express Enterprise od verze 6.0 by měl obsahovat rovněž aplikaci Document Express Editor, která umožnuje další úpravu dokumentů a chtěl jsem ji vyzkoušet. (Alternativní aplikací pod linuxem je djvused z balíku djvulibre). Abych tedy měl možnost posoudit jeho funkčnost, tak jsem se musel poohlédnout jinde.

    Na internetu lze nalézt jeho předchůdce, aplikaci DjVuSolo 3.1 - bohužel, ta ještě nespolupracovala s OCR. Dohrabal jsem se také k verzi Document Express Editor 4.1 pro, ta ale neměla OCR engine a stejně nešla rozchodit. Tak jsem šel dál. Document Express Editor 5.1 mě nadchnul a 6.1 je už fakt dobrá aplikace. Použitý OCR engine je sice starší (obě verze užívají týž), ale editor má rozšířenou funkčnost o některé další prvky. Pokud jde o cenu za jakou lze legálně opatřit tento software opatřit, našel jsem přehledný ceník jednom polském webu a suma je to pěkně mastná. Nicméně, porovnám-li to s částkami za které se u nás nakupují mnohem větší kraviny.. tak mi přijde docela přiměřená.


    Další komerční aplikací pro zpracování DjVu dokumentů, která používá OCR engine z FineReaderu 7.0 je JRAPublish 2.0. Bohužel na rozdíl od výše uvedené aplikace od LizardTechu končí pokusy o spuštění pod wine chybovou hláškou a tudíž nefunguje.

    Opensource nástroje a DjVu

    Kdo podléhal panice pod dojmem že solidní software je pouze za prachy a už lovil v portmonce, nechť stáhne ruku zpět. Teda pokud přistoupí na fakt že něco za něco platí všude.

    Balík djvulibre se stále vyvíjí a záleží jen na vás jestli se objeví nástroj podobný jako Document Express Editor i pod GPL - bylo by to určitě užitečnější než vyvíjet tisícistoprvní připitomělý manažer souborů.

    Při mém posledním testování gocru z CVS archívu jsem zjistil, že se zlepšila jeho možnost učení, přestal mít problémy s diakritikou a - to nejlepší nakonec - začal produkovat i XML soubor který v sobě obsahuje vše potřebné pro to, aby jej bylo možno libovolným XSLT parserem zpracovat do DjVuXML a vložit do DjVu dokumentu přes djvuparser

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    3.8.2006 15:39 KS | skóre: 10 | blog: blg | Horní polní u západní dolní
    Rozbalit Rozbalit vše Re: Linux, OCR a DjVu dokumenty
    Skvělý příspěvek, díky!
    Pochybnost, nejistota - základ poznání
    3.8.2006 19:16 helb | skóre: 9 | blog: helb | Kralovice
    Rozbalit Rozbalit vše Re: Linux, OCR a DjVu dokumenty
    Někde mám (originální :) ) disketu s Recognita 1.0 ... Až bude někdy trošku víc času, namontuju (a namountuju :) ) FDD mechaniku a zkusím to rozjet ve wine...
    Ovládání hlasem? cat /dev/dsp > /dev/hda1
    regine avatar 18.9.2007 20:26 regine | skóre: 22 | blog: regine
    Rozbalit Rozbalit vše Re: Linux, OCR a DjVu dokumenty

    Koupil jsem skener Umax Astra s Recognita pro Win98 (boundle v ceně) a mohu říci, že proti placené verzi neuměla jen tabulky do MS-Excel a MS-Word. Dodnes užívám v plné spokojenosti.

    Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
    17.5.2019 13:11 how to clear cookies chrome in windows 10
    Rozbalit Rozbalit vše Re: Linux, OCR a DjVu dokumenty
    Hello everyone i am here and welcome to this site and today we learn a new issue how to clear cookies chrome in windows 10 this is common issue,some users asked how can clear my browser cookies and search data.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.