abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
včera 22:44 | Komunita

Joinup informuje, že Mnichov používá open source groupware Kolab. V srpnu byl dokončen dvouletý přechod na toto řešení. V provozu je asi 60 000 poštovních schránek. Nejenom Kolabu se věnoval Georg Greve ve své přednášce Open Source: the future for the European institutions (SlideShare) na konferenci DIGITEC 2016, jež proběhla v úterý 29. listopadu v Bruselu. Videozáznam přednášek z hlavního sálu je ke zhlédnutí na Livestreamu.

Ladislav Hagara | Komentářů: 1
včera 15:30 | Zajímavý projekt

Společnost Jolla oznámila v příspěvku Case study: Sailfish Watch na svém blogu, že naportovala Sailfish OS na chytré hodinky. Využila a inspirovala se otevřeným operačním systémem pro chytré hodinky AsteroidOS. Použita je knihovna libhybris. Ukázka ovládání hodinek na YouTube.

Ladislav Hagara | Komentářů: 5
včera 14:15 | Nová verze

Byla vydána verze 7.1.0 skriptovacího jazyka PHP používaného zejména k vývoji dynamických webových stránek. Jedná se o první stabilní verzi nejnovější větvě 7.1. Přehled novinek v dokumentaci. Podrobnosti v ChangeLogu. K dispozici je také příručka pro přechod z PHP 7.0.x na PHP 7.1.x.

Ladislav Hagara | Komentářů: 0
včera 12:55 | Nová verze

Google Chrome 55 byl prohlášen za stabilní. Nejnovější stabilní verze 55.0.2883.75 tohoto webového prohlížeče přináší řadu oprav a vylepšení (YouTube). Opraveno bylo také 36 bezpečnostních chyb. Mariusz Mlynski si například vydělal 22 500 dolarů za 3 nahlášené chyby (Universal XSS in Blink).

Ladislav Hagara | Komentářů: 4
včera 11:55 | Pozvánky

Máte rádi svobodný software a hardware nebo se o nich chcete něco dozvědět? Přijďte na 135. sraz spolku OpenAlt, který se bude konat ve čtvrtek 8. prosince od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Sraz bude tentokrát tématický. Bude retro! K vidění budou přístroje jako Psion 5mx nebo Palm Z22. Ze svobodného hardwaru pak Openmoko nebo čtečka WikiReader. Přijďte se i vy pochlubit svými legendami, nebo alespoň na pivo. Moderní hardware má vstup samozřejmě také povolen.

xkucf03 | Komentářů: 0
včera 00:10 | Nová verze

Byla vydána verze 3.2 svobodného systému pro detekci a prevenci průniků a monitorování bezpečnosti počítačových sítí Suricata. Z novinek lze zmínit například podporu protokolů DNP3 a CIP/ENIP, vylepšenou podporu TLS a samozřejmě také aktualizovanou dokumentaci.

Ladislav Hagara | Komentářů: 0
1.12. 21:00 | Nová verze

Byla vydána beta verze Linux Mintu 18.1 s kódovým jménem Serena. Na blogu Linux Mintu jsou hned dvě oznámení. První o vydání Linux Mintu s prostředím MATE a druhé o vydání Linux Mintu s prostředím Cinnamon. Stejným způsobem jsou rozděleny také poznámky k vydání (MATE, Cinnamon) a přehled novinek s náhledy (MATE, Cinnamon). Linux Mint 18.1 bude podporován až do roku 2021.

Ladislav Hagara | Komentářů: 0
1.12. 16:42 | Nová verze

Byl vydán Devuan Jessie 1.0 Beta 2. Jedná se o druhou beta verzi forku Debianu bez systemd představeného v listopadu 2014 (zprávička). První beta verze byla vydána v dubnu letošního roku (zprávička). Jedna z posledních přednášek věnovaných Devuanu proběhla v listopadu na konferenci FSCONS 2016 (YouTube, pdf).

Ladislav Hagara | Komentářů: 0
1.12. 15:16 | Komunita

Na GOG.com začal zimní výprodej. Řada zlevněných her běží oficiálně také na Linuxu. Hru Neverwinter Nights Diamond lze dva dny získat zdarma. Hra dle stránek GOG.com na Linuxu neběží. Pomocí návodu ji lze ale rozběhnout také na Linuxu [Gaming On Linux].

Ladislav Hagara | Komentářů: 1
1.12. 13:14 | Bezpečnostní upozornění

Byla vydána verze 2.7.1 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Řešeno je několik bezpečnostních problémů. Aktualizován byl především Tor Browser na verzi 6.0.7. Tor Browser je postaven na Firefoxu ESR (Extended Support Release) a právě ve Firefoxu byla nalezena a opravena vážná bezpečnostní chyba MFSA 2016-92 (CVE-2016-9079, Firefox SVG Animation

… více »
Ladislav Hagara | Komentářů: 0
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (24%)
 (29%)
 (7%)
 (5%)
 (3%)
Celkem 759 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama

Dotaz: OCR v Linuxu

kyknos avatar 12.7.2006 11:37 kyknos | skóre: 18 | blog: Quid novi? | Ranša Rosa
OCR v Linuxu
Přečteno: 1635×
Existuje použitelný free SW pro optické rozpoznávání znaků v Linuxu? Zkusil jsem Kooku s OCRAD, ale výsledkem čtení skenu poměrně kvalitního výtisku z inkoustové tiskárny je něco takového:

' och moak, ge òg k míe plílh ohmáv án poutvem rnmg koua o ocanho nadcR. akk o apatkO nâea me étnou o epgmýh ak navza akko kon4kg, oplul wkdy vak v nmuwóA PQkraPova um d a thdy shnìk& vylaO m a uhl Qoaouàl m dgkoae,mì akflPk nPpNe parweaov ğmo, k e, nbmou ,k aanot e lûy KOž 4nu PQ&o ostímou, pokusl no'u naoâní konmku nm pìouven, mným kaunn o cano nad a onïm mpnnQvánm hmec hke po& k mì bokm, rntnu pouv h olokQvt pramu tlu vdum mrm k hmíc,í),

Poradí někdo něco lepšího či nějaký trik v nastavení? Potřebuji něco málo češtiny a hlavně angličtinu.
no nemuze clovek kazdy den sukat na tropicke plazi s absolventkou matematicko fyzikalni fakulty

Odpovědi

Marek Stopka avatar 12.7.2006 11:43 Marek Stopka | skóre: 57 | blog: Paranoidní blog | London, United Kingdom
Rozbalit Rozbalit vše Re: OCR v Linuxu
Google ví, napoví.
Klíčová slova: ocr pod linuxem
12.7.2006 12:58 Aleš Kapica | skóre: 45 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: OCR v Linuxu
Odpověd je prostá - slabota. Malý zájem o nákup takového software u uživatelů linuxu, takže komerční firmy na linuxové porty celkem kašlou - i když třeba pro Abbyfinereader byl testován nějaký engine.

Pokud jde o free software, tak je asi tato oblast většině linuxových programátorů hodně vzdálená a řada z nich raději programuje variace na stokrát omleté téma (viz několikero nadstaveb pro přehrávání audia a videa).

Osobně si dovedu představit aplikace které z hlediska programátora vděčné nejsou nicméně by mohly být hodně revoluční v oblasti kancelářského software. Kvalitní OCR kombinované s aplikací pro tvorbu DJVU dokumentů.
kyknos avatar 12.7.2006 14:03 kyknos | skóre: 18 | blog: Quid novi? | Ranša Rosa
Rozbalit Rozbalit vše Re: OCR v Linuxu
Jo, asi by to bylo užitečnější než JXP commander...
no nemuze clovek kazdy den sukat na tropicke plazi s absolventkou matematicko fyzikalni fakulty
Marek Stopka avatar 12.7.2006 14:05 Marek Stopka | skóre: 57 | blog: Paranoidní blog | London, United Kingdom
Rozbalit Rozbalit vše Re: OCR v Linuxu
A asi taky n-násobně šložitější, kde n="hodně velké číslo".
12.7.2006 14:41 Aleš Kapica | skóre: 45 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: OCR v Linuxu
Kdybych zvládal programování na vyšší úrovni než nějaké ty skriptíky, tak bych se toho ujal, ale bohužel. Programování v C++ je pro mě tak trochu jungle.
12.7.2006 15:36 happy barney | skóre: 34 | blog: dont_worry_be_happy
Rozbalit Rozbalit vše Re: OCR v Linuxu
ono je to viac o teorii ako o schopnostiach programovania v niektorom jazyku
12.7.2006 15:41 Kyosuke | skóre: 28 | blog: nalady_v_modre
Rozbalit Rozbalit vše Re: OCR v Linuxu
Rozpoznávání čehokoliv je úplně jiný kalibr než nějaký „fajlkomendr“. Si jen vezmi, že třeba na VŠ tě k tomuhle naučí tak akorát úplné základy. A vůbec nejde o C++.
kyknos avatar 12.7.2006 13:06 kyknos | skóre: 18 | blog: Quid novi? | Ranša Rosa
Rozbalit Rozbalit vše Re: OCR v Linuxu
No při použití toho GOCR doporučeného v odkazu jsem dostal sice něco mnohem lepšího než z OCRAD, lze rozpoznat jistou podobnost s originálním textem, ale pořád je rychlejší přepsat to ručně než opravovat výsledek z GOCR :(
no nemuze clovek kazdy den sukat na tropicke plazi s absolventkou matematicko fyzikalni fakulty
12.7.2006 16:04 kilinux | skóre: 15 | blog: KILinux
Rozbalit Rozbalit vše Re: OCR v Linuxu
Z linuxovych OCR leze jenom tahle hatmatilka...Protoze pouzitelny linuxovy OCR (zatim) neni. Prakticky pouzitelny OCR program, ktery jsem uspesne pouzival na cestinu, byl ABBY Finereader. Ten je ovsem pro windows...
12.7.2006 20:22 Ctirad Feřtr | skóre: 43 | Praha
Rozbalit Rozbalit vše Re: OCR v Linuxu
Finereader engine je i pro linux, ale chybí tomu UI a je potřeba si to koupit za peníze.
12.7.2006 16:22 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
Rozbalit Rozbalit vše Re: OCR v Linuxu
Nemáte ten papír obráceně?

Jinak: http://www.linuxexpres.cz/skenovani-je-radost
Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress
kyknos avatar 12.7.2006 18:02 kyknos | skóre: 18 | blog: Quid novi? | Ranša Rosa
Rozbalit Rozbalit vše Re: OCR v Linuxu
Ne to vážně nemám :)
no nemuze clovek kazdy den sukat na tropicke plazi s absolventkou matematicko fyzikalni fakulty
NbS avatar 21.8.2006 09:22 NbS | skóre: 26 | blog: Linux jako Linux ... vsude je neco jako /etc | Prague
Rozbalit Rozbalit vše Re: OCR v Linuxu
tak mas neco blbe me to zobrazuje presne tak jako na tom screenu na linux expresu :) max. tak s 20chybami na A4
Pan Bily byli bily strop, aby byl bily ... (Opravdu si myslite, ze je to spravne) ?
12.7.2006 20:49 baltazar2
Rozbalit Rozbalit vše Re: OCR v Linuxu
Naprosto spickovy je komercni OCR pro Linux, ktery najdete zde:
http://www.vividata.com/index.html
Ma to command-line rozhrani a umi to spoustu pokrocilych veci, napr. delat z bitmapovych PDF indexovana PDF (kde pod bitmapou je vrstva textu, takze se da vyhledavat).

Zkuste trial verzi, uvidite, ze se vysledek s gocr neda srovnat. Pak se ovsem podivate na cenik a zjistite, ze si to v tomto zivote nekoupite (a pokud nepracujete pro hodne velkou firmu, tak nejspis ani vas zamestnavatel). Z toho uz si pak vyvodte dusledky jake chcete. (Hint: "nahradte" proces vvlicense, poslouchajici na portu 10102; na zbytek prijde asi kazdy, kdo umi pracovat s strace).
21.8.2006 22:09 Kyosuke | skóre: 28 | blog: nalady_v_modre
Rozbalit Rozbalit vše Re: OCR v Linuxu
Můžeme se na něj složit a nainstalovat to na server, na kterém bude SSH, ne? :-)
Max avatar 13.7.2006 00:11 Max | skóre: 64 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: OCR v Linuxu
Dřív jsem tahal titulky z DVDček a na netu jsem našel stránky nějakýho chlapa, co se tím zabýval a měl na to svůj vlastní soft, myslím, že to měl napsaný asi v pythonu. Jako fakt dsrný, ale byl to ten nej free soft na tahání těch titulků do textu. Bohužel si už nevzpomínám na stránky projektu a ani na projekt jako takový :(. OCR pod linuxem je fakt slabota, jedna z mála věcí (GPL věcí), která stále chybí :(
Zdar Max
Měl jsem sen ... :(
20.8.2006 19:40 Rezza
Rozbalit Rozbalit vše Re: OCR v Linuxu
Tak cumim do zdrojaku ocrad a podle nich by mel umet rozpoznat ruzne znaky s hacky, ale at se snazim, jak se snazim, tak nic... Pac vubec nepozna hacek jako hacek... Tak se v tom zacinam hrabat, jen na tom mojem stroji co ted mam je C++ neuveritelneeeee pomaleeee...

Horsi je, ze ocrad ma znaky primo zadratovane natvrdo ve zdrojaku, tak se neda ani naucit...

Ale rozhodne me to bavi vic nez doplnovat miliardu pismenek i kdyz pres ispell:)
20.8.2006 21:31 Pavel Kysilka
Rozbalit Rozbalit vše Re: OCR v Linuxu
zdravim,

no, to jste dospel k zaveru, co ja s jorc (gocr). bohuzel zadratovana aplikacni logika v aplikaci je mnohdy smrt techto projektu. dal to uz nevyroste.

co jsem koukal na gocr, tak dodelat heuristiku na hacek nad d,t,n uz je vcelku prusvih. i kdyz je to obracena carka. najednou uz to je nepresne a musite dost kodit.

osobne ma podle me smysl dela ocr na -nixech timto stylem:

rozlis nejak radky - vem pismeno - porovnej to s fonty dodanymi z xfont-serveru - a to, co je nepravdepodobnejsi uznej jako vysledne pismeno.

pripadne nainstaluj dalsi fonty a zpet na stromy.

ani bych to moc neucil. ty data jiz jsou. pripadne stahnout svg data z unicode.org ci odkud. prusvih jsou arabske a jine cajove fonty.

jenomze, pokud maji ocr fungovat a prezit v teto dobe, tak pro uzivatele jsou dulezite struktury dat a nejaka metadata. tedy tabulky, obrazky, oramovani. a idealne to cpat do nejakych struktur. ne -li z toho tvorit nejake standart dokumenty typu oasis document.

cim by se dalo vitezit, je porovnavat 2 formulare ci stejne subjekty a ziskavat tak metadata.

ocr je vcelku zajimavy byznys. premyslel jsem o tom. i kdyz casem to spise bude o rozpoznavani digitalnich dat typu prevazne text.

dalsi namet by mozna mohly byt programy pro nevidome anebo aplikace na automaticke testovani desktop veci. kdyz vidim, co se vsechno dava za balast na www stranky, tak uz vcelku uvazuju o vlastni desktop aplikacce na cteni, toho, co chci ja a udelat z www stranky webovou sluzbu. a pouze definovat cesty, co odkud brat.

pokud by se to melo delat komercne, tak od x-1000 stranek mesicne, by se platilo za stranku, a ne za aplikaci. coz uzivateli s naskenovanou knizkou asi nebude vadit, ale firma to cvakne velmi rada. nebo pronajem vypocetniho vykonu na oplatku.

ale toto moje postrehy za posledni roky. najednu stranu zajimava uloha. protoze kodeni na relacnich strukturach zacina byt pro me uz vcelku nuda. je otazkou, do ceho se pustit dale.

bye gf

goldenfish at bsys dot cz
Rezza avatar 20.8.2006 22:08 Rezza | skóre: 25 | blog: rezza | Brno
Rozbalit Rozbalit vše Re: OCR v Linuxu
Tak ale porad ocrad lepsi vysledek nez gocr a to i gocr s ucenim... Ted do toho ocrad si pridavam nejake ladici vypisy, abych se aspon zorientoval a co tam vlastne go a bud na neco prijdu nebo to smaznu a bude to ;) Ale i brutalni hack pouze na cestinu by byl uspech... A kdyz tak premyslim, co si vybrat za tema na diplomku :))) Speech@FIT dela best soft na rozpoznavani mluvenych jazyku na svete, tak proc ne i best OCR *JOKINGLY*
21.8.2006 16:51 Rezza
Rozbalit Rozbalit vše Re: OCR v Linuxu
Tak uz jsem do ocrad dostal "ř" a "č"... Jen nevim proc nejede "š" a "ž", které tam už bylo :)
21.8.2006 17:05 Rezza
Rozbalit Rozbalit vše Re: OCR v Linuxu
Kodovani...
21.8.2006 21:03 Pavel Kysilka
Rozbalit Rozbalit vše Re: OCR v Linuxu
zdravim,

premyslel jsem v nekurackych vlacich CD dneska o tom, co jsme tu probirali, kdyz jsem jel vyrizovat pas. dam vam 4 odpovedivi dvou.

ocr - bud lidi budou potrebovat strukturovat dokumenty a mit v tom poradek + nejaka efektivita a produktivita prace. tudiz ocr bude prinosem. vzhledem k tomu, ze papir se v nasi bananove republice hojne pouziva i jako dulezity informacni prostredek, tak digitalizace bude mit budoucnost.

zvuk - vo bude mit mozna budoucnost je rozpoznavani hlasu. ze jsou ve firmach telefonni ustredny, to je asi znamo a ze to vse nahrava a nahrava, to taky. a bonzovat se v teto republice asi bude. to je klasika. takze i toto ma budoucnost.

add ocr a rychlost: chcete -li zvitezit co se tyce ocr, tak vemte jedinecna pismena obsahu na vyhodnoceni v zakladni versi. zbytek namapujte do nejakeho seznamu. tyto vyhodnotte a je vyhrano. podle me stejnym zpusobem pujdou komercni ocr. nevim, jak opensource produkty. rychlost asi nebude uplne dobra.

kazdopadne diplomka by podle stare skoly mela odpovidat uplatneni v cilovem oboru.

tak dobrou ruku pri rozhodovani.

bye gf
21.8.2006 21:51 Rezza
Rozbalit Rozbalit vše Re: OCR v Linuxu
Vim jedno IS nechci delat, i kdyz je dela dnes kazdy... Proste me to nebavi, mozna u toho jednou trebas skoncim ale, nikdy nerikej nikdy, i tam se najdou zajimave veci... Takze asi tak... Je tezke si nejak v IT vybrat co by clovek chtel delat za dva tri roky, kdyz v tomto odvetvi se za tu dobu stane a zmeni to co jinde za dve tri desetileti... Jinak prace zatim uspesne pokracuji, ale ocrad je celkem drsne zadratovany vcetne kodovani, takze vysledkem bude asi iso8859-2 only verze a to jeste subset jen na ceske znaky, proste ty nase udelatka...

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.