Portál AbcLinuxu, 6. května 2025 00:28
OCRFeede je ve skutečnosti jen grafické rozhraní ke skutečným OCR programům. Celé vylepšení spočívá v tom, že autor přidal možnost si nastavit nějaké další volby, které se těm programům předávají a navíc volá před vlastním OCR další externí program, který upravuje deformace obrazu (předchozí verze volala jen Unpaper).
I přes tato „zdokonalení“ je výsledek rozpoznávání dosti zoufalý, a nejen pro češtinu. Kdybys našel kvalitní program OCR v CLI, který by to mohlo volat, tak by ti to fungovalo dobře. Já jsem testoval dva, se kterými do standardně spolupracuje - ocrad a tesseract. Z těch dvou byl trochu lepší tesseract. Češtinu totálně nezvládal ani jeden. Ale možná to jde nějak vyštelovat, zkoušel jsem to jen zběžně v rámci toho, že jsem to překládal do češtiny.
-l cze -o /tmp/cune $IMAGE; cat /tmp/cunePřidáte do pole argumenty výkonného programu. Stupido, viďte?
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.