OCRFeeder 0.7 (diskuse)

Zkoušel to někdo, funguje to s češtinou?

2.8.2010 21:25 Marv-CZ | skóre: 21
Rozbalit Rozbalit vše Re: OCRFeeder 0.7 podporuje rozpoznávání křivého textu

OCRFeede je ve skutečnosti jen grafické rozhraní ke skutečným OCR programům. Celé vylepšení spočívá v tom, že autor přidal možnost si nastavit nějaké další volby, které se těm programům předávají a navíc volá před vlastním OCR další externí program, který upravuje deformace obrazu (předchozí verze volala jen Unpaper).

I přes tato „zdokonalení“ je výsledek rozpoznávání dosti zoufalý, a nejen pro češtinu. Kdybys našel kvalitní program OCR v CLI, který by to mohlo volat, tak by ti to fungovalo dobře. Já jsem testoval dva, se kterými do standardně spolupracuje - ocrad a tesseract. Z těch dvou byl trochu lepší tesseract. Češtinu totálně nezvládal ani jeden. Ale možná to jde nějak vyštelovat, zkoušel jsem to jen zběžně v rámci toho, že jsem to překládal do češtiny.

3.8.2010 08:03 stilett
Rozbalit Rozbalit vše Re: OCRFeeder 0.7 podporuje rozpoznávání křivého textu

Tesseract není špatný, ale češtinu neumí. Lze ho česky naučit, ale nikdo se do toho zatím bohužel nepustil.

3.8.2010 08:28 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: OCRFeeder 0.7 podporuje rozpoznávání křivého textu

Ta aplikace - gui chcete-li, má mnohem větší potenciál než vůbec tušíte. Pokud jde o vlastní OCR, mocí jednoduchého triku ho lze naučit pracovat i s cuneiform:

Menu nástroje -> Výkonné programy OCR přidat.. a teď ta finta:

-l cze -o /tmp/cune $IMAGE; cat /tmp/cune

Přidáte do pole argumenty výkonného programu. Stupido, viďte?

4.8.2010 11:48 Drew | skóre: 15 | blog: Supi_hnizdo | Praha
Rozbalit Rozbalit vše Re: OCRFeeder 0.7 podporuje rozpoznávání křivého textu

A funguje tam ta čeština uspokojivě?

4.8.2010 11:57 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: OCRFeeder 0.7 podporuje rozpoznávání křivého textu

Vyzkoušej a uvidíš.. ;-)

Ocrodjvu s cuneiform pracuje rovněž. Na odkazované stránce najdeš ukázku výsledku, porovnanou s výsledkem profesionálního ocr (pravděpodobně engine z Readiris 10)

4.8.2010 12:59 Drew | skóre: 15 | blog: Supi_hnizdo | Praha
Rozbalit Rozbalit vše Re: OCRFeeder 0.7 podporuje rozpoznávání křivého textu

no já vím, ale to se mi nechce, proto se ptám. Asi před rokem jsem totiž potřeboval něco použít a přišlo mi, že se to na češtině vůbec nechytalo, ale možná jsem jenom nenašel nic dobrého. Koukám, že v tom odkazu to ale vypadá, že to funguje docela dobře.

chcelo by to OCR na CAPTCHA aby sa Indovia netrápili/nezarábali :-D

3.8.2010 08:43 Tomáš Veselý
Rozbalit Rozbalit vše Re: OCRFeeder 0.7 podporuje rozpoznávání křivého textu

Něco takového mám, potřeboval jsem odesílat sms zdrarma, tak jsem si během víkendu napsal ocrko, které láme o2, vodafone i t-mobile. U o2 to teď trošku předělali, neměl jsem čas se na to mrknout, ale mělo by stačit naučit program nové sadě obrázků a mělo by to jet dál.

3.8.2010 08:52 Michal Fecko | skóre: 31 | blog: Poznámkový blog
Rozbalit Rozbalit vše Re: OCRFeeder 0.7 podporuje rozpoznávání křivého textu

Nemas niekde SVN/GIT repozitar ? Podel sa s komunitou ;-)

3.8.2010 09:49 Murry | skóre: 16 | Brno
Rozbalit Rozbalit vše Re: OCRFeeder 0.7 podporuje rozpoznávání křivého textu

Také bych to bral:) Hlavně bych chtěl t-mobile a hodit to do jabberu.