abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 13:44 | Zajímavý software

    V pátek 6. a sobotu 7. března proběhl v pražském sídle Nejvyššího kontrolního úřadu (NKÚ) Hackathon veřejné správy 7.1. Publikovány byly vytvořené aplikace. V kategorii projektů rozvíjených z krajského kola zvítězil tým „Mackokládi“. Čtyři středoškoláci ze Dvora Králové uspěli s aplikací KompaZ. Jde o digitálního průvodce, který pomůže s rychlou a srozumitelnou orientací v životních i krizových situacích „krok za krokem“. Aplikace

    … více »
    Ladislav Hagara | Komentářů: 2
    dnes 13:33 | Nová verze

    QGIS, svobodný desktopový GIS, byl vydán v nové hlavní verzi 4.0. Změny zahrnují několik nových analytických a editačních funkcí, rozšíření podpory 3D, více možností úprav uživatelského rozhraní či mnoho dalších zlepšení použitelnosti. Řada 3.44 má aktualizace plánovány do září.

    |🇵🇸 | Komentářů: 0
    dnes 05:11 | Komunita

    Dan Blanchard vydal knihovnu pro Python chardet v nové verzi 7.0.0. S novou verzí byla knihovna přelicencována z LGPL na MIT. Souhlasili s tím všichni přispěvatelé? Dan Blanchard souhlasy vůbec neřešil. Zaúkoloval umělou inteligenci (Claude), aby knihovnu zcela přepsala a výslovně jí nařídil, aby nepoužila žádný LGPL kód. Dan Blanchard tvrdí, že se jedná o clean room design. Protistrana argumentuje, že umělá inteligence byla trénována

    … více »
    Ladislav Hagara | Komentářů: 12
    včera 18:44 | Komunita

    Andy Nguyen si na svou herní konzoli PlayStation 5 (PS5) pomocí exploitu Byepervisor nainstaloval Linux (Ubuntu). V Linuxu si spustil Steam a PS5 tak proměnil v Steam Machine. Na PS5 může hrát hry, které jsou vydané pouze pro PC a jsou na Steamu [Tom's Hardware].

    Ladislav Hagara | Komentářů: 9
    včera 12:22 | Nová verze

    Správce sbírky fotografií digiKam byl vydán ve verzi 9.0.0. Jedná se o větší vydání provázené aktualizacemi knihoven. Mnoho dílčích změn se vedle oprav chyb týká uživatelského rozhraní, mj. editace metadat.

    |🇵🇸 | Komentářů: 1
    7.3. 13:55 | Nová verze

    Byla vydána verze 2026 distribuce programu pro počítačovou sazbu TeX s názvem TeX Live (Wikipedie). Přehled novinek v oficiální dokumentaci.

    Ladislav Hagara | Komentářů: 28
    6.3. 23:22 | Humor

    Jihokorejská Národní daňová služba (NTS) zabavila kryptoměnu Pre-retogeum (PRTG) v hodnotě 5,6 milionu dolarů. Pochlubila se v tiskové zprávě, do které vložila fotografii zabavených USB flash disků s kryptoměnovými peněženkami spolu se souvisejícími ručně napsanými mnemotechnickými obnovovacími frázemi. Krátce na to byla kryptoměna v hodnotě 4,8 milionu dolarů odcizena. O několik hodin ale vrácena, jelikož PRTG je extrémně nelikvidní, s denním objemem obchodování kolem 332 dolarů a zalistováním na jediné burze, MEXC [Bitcoin.com].

    Ladislav Hagara | Komentářů: 10
    6.3. 16:33 | Nová verze

    Komunita kolem Linuxu From Scratch (LFS) vydala nové verze knih s návody na instalaci vlastního linuxového systému ze zdrojových kódů Linux From Scratch 13.0 a Beyond Linux From Scratch 13.0. Pouze se systemd.

    Ladislav Hagara | Komentářů: 0
    6.3. 16:00 | Nová verze

    Byla vydána nová stabilní major verze 25.12 linuxové distribuce primárně určené pro routery a vestavěné systémy OpenWrt (Wikipedie). Jedná se o nástupce předchozí major verze 24.10. Přehled novinek v poznámkách k vydání. Podporováno je více než 2200 zařízení.

    Ladislav Hagara | Komentářů: 0
    6.3. 04:44 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za únor (YouTube). Odstraněn byl veškerý kód napsaný ve Swiftu. JavaScriptový engine LibJS byl reimplementován v Rustu.

    Ladislav Hagara | Komentářů: 4
    Které desktopové prostředí na Linuxu používáte?
     (17%)
     (7%)
     (0%)
     (11%)
     (28%)
     (2%)
     (5%)
     (2%)
     (13%)
     (25%)
    Celkem 1036 hlasů
     Komentářů: 25, poslední 3.2. 19:50
    Rozcestník

    Dotaz: OCR

    27.8.2013 08:18 juvi
    OCR
    Přečteno: 596×
    Zdravím, hledám nějaký OCR a našel jsem info, že slušně fungovalo Cuneiform. Ovšem (prohlídkou webu) mám dojem, že dnes to asi na Linuxu moc nejede a openocr.org se mi jeví poněkud mrtvé. Provozujete to někdo? Gocr moc slavné není, potřeboval bych něco lepšího.

    Odpovědi

    27.8.2013 08:39 onno
    Rozbalit Rozbalit vše Re: OCR
    yagf jako frontent pro cuneiform a tesseract.
    Luboš Doležel (Doli) avatar 27.8.2013 10:12 Luboš Doležel (Doli) | skóre: 98 | blog: Doliho blog | Kladensko
    Rozbalit Rozbalit vše Re: OCR
    Z mých zkušeností byl Tesseract vždy nejlepší. Cuneiform měl horší výsledky a ještě mi zahazoval diakritiku (ale to možná byla moje chyba).
    27.8.2013 10:25 onno
    Rozbalit Rozbalit vše Re: OCR
    ano, také mám lepší zkušenosti s Tesseractem.
    27.8.2013 15:48 Radun
    Rozbalit Rozbalit vše Re: OCR
    Problémy s češtinou u cuneiform v mém případě zmizely po vlastním překladu s patchem (na stránkách projektu), který řeší Bug #978183 .
    27.8.2013 09:30 Radovan Garabík
    Rozbalit Rozbalit vše Re: OCR
    ABBYY finereader. Je to síce platené, ale pomerne dobrý SW.
    27.8.2013 09:49 mica
    Rozbalit Rozbalit vše Re: OCR
    Dovolte, abych vás opravil. Nikoli poměrně dobrý, nýbrž velmi dobrý. K některým skenerům dodávána ořezaná verze (podpora omezeného počtu jazyků, nicméně mně angličtina a čeština bohatě stačí), i ta nicméně funguje velmi dobře.
    27.8.2013 09:57 Radovan Garabík
    Rozbalit Rozbalit vše Re: OCR
    Pomerne, lebo v linuxovej verzii sa nedajú natrénovať vlastné znaky, CLI má pomerne obskurnú voľbu parametrov (záleží na poradí!), nedokumentovane vyrába veľké dočasné súbory v /tmp (takže s tmpfs dopadne niekedy na hubu), nedá sa použiť vlastný spellchecker, nepodporuje SMP atď....

    Windows verzia je na tom lepšie.
    29.8.2013 07:21 mica
    Rozbalit Rozbalit vše Re: OCR
    Linuxovou verzi neznám, používám verzi pro Windows pod Wine a u ní jsem jmenované problémy nezaznamenal, takže moje hodnocení platí pro ni.
    27.8.2013 09:52 Sandik | skóre: 13 | blog: obcasny_obcasny_blog | Praha (když zrovna nejsem někde jinde ;o)
    Rozbalit Rozbalit vše Re: OCR
    Používám asi deset let starý ABBYY FineReader pro Win přes Wine. Funguje to spolehlivě, jenom mu musím předhodit jako "vstup" nikoli přímo scanner (na tom padá) ale předtím pomocí Gimpu a XSane vytvořené jpg soubory.
    ...
    Luboš Doležel (Doli) avatar 27.8.2013 09:58 Luboš Doležel (Doli) | skóre: 98 | blog: Doliho blog | Kladensko
    Rozbalit Rozbalit vše Re: OCR
    Já jsem zkoušel verzi pro Linux a ten program se mi pořádně ani nespustil a padal.
    27.8.2013 10:36 Sandik | skóre: 13 | blog: obcasny_obcasny_blog | Praha (když zrovna nejsem někde jinde ;o)
    Rozbalit Rozbalit vše Re: OCR
    Vůbec netuším, to to má i verzi pro Linux. Každopádně Windowsí verze, kterou jsem mimochodem kdysi kdesi získal zdarma, funguje spolehlivě. Poradí si s diakritikou, zvládá i formátované texty (sloupce, obrázky, nadpisy, tučné písmo a kurzivu), je sto schroustat i ne moc dobré fotky z digitálního foťáku. Prostě spokojenost.
    ...
    27.8.2013 10:49 Sandik | skóre: 13 | blog: obcasny_obcasny_blog | Praha (když zrovna nejsem někde jinde ;o)
    Rozbalit Rozbalit vše Re: OCR
    mělo být "že to má", sorry za ten překlep
    ...
    27.8.2013 14:03 Radun
    Rozbalit Rozbalit vše Re: OCR
    Celkem dlouho jsem zkoušel cuneiform i tesseract. Tesseract se mi zdál o něco lepší. U cuneiform jsem narazil na dvě chyby, které způsobily ukončení programu s chybou. Došlo k tomu vždy, pokud na stránce nebyl rozpoznán žádný text (např. prázdná stránka - prováděl jsem převod celé knihy automaticky) a pak tehdy, pokud bylo rozlišení větší než 3500px v libovolném směru.

    Tesseract má zřejmě o něco lépe vyřešen jakýsi pre-processing, který pomocí nastavení prahových hodnot černé bílé převede obrázek na 1-bit ČB. Pokud jsem totiž podstrčil programu cuneiform obrázek takto upravený pomocí imagemagick, pak byl výsledek slušný (asi stejný jako u tesseract); jinak u obrázeku 8-bit šedé (neupravený, rovnou ze scanneru) dopadlo rozpoznání lépe vždy za použití tesseract.

    (Oba programy podporují české znaky.)

    Pro jednorázovou akci < 100 stránek je také možné stáhnout demo verzi placeného abbyyocr9. Tento program jsem vyzkoušel a musím potvrdit, že i velmi nekvalitní text ze 100 let starých knih dokázal rozpoznat velmi slušně a přitom si také poradil se stíny, kazy a různými jinými nectnostmi; v tomto případě byl výsledek obou open source programů špatný ( byl jen o něco lepší při pracné úpravě pomocí imagemagick). Jakékoliv upravování obrázku pomocí imagemagick jsem u abbyyocr shledal jako zbytečné nebo horší. Nejlepší výsledek byl vždy rovnou s obrázkem ze scanneru (barevný i čb); program si s tím sám poradil nejlépe. Škoda jen že cena programu je v linux verzi vysoká a lincence je časově nebo od počtu stránek (už nevím přesně) omezená.

    Stejně dobré výsledky jako s abbyyocr se mi podařilo dosáhnout také s on-line OCR na www.onlineocr.net ; mám podezření, že jim tam běží stejný program. Pro převod pár stránek běžného textu je to asi nejlepší a nejrychlejší řešení.
    28.8.2013 22:34 jik
    Rozbalit Rozbalit vše Re: OCR
    Díky, tesseract se mi na OpenSUSE 12.3 podařilo nainstalovat. Budu zkoušet.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.