abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 18:11 | IT novinky

    Společnost IBM představila novou generaci svých serverů: IBM Power11.

    Ladislav Hagara | Komentářů: 0
    dnes 15:33 | Komunita

    Multiplatformní digitální pracovní stanice pro práci s audiem Ardour byla postavena na GTK2. Vývojáři neplánovali její portaci na GTK3 nebo GTK4. Naopak, v lednu loňského roku si vytvořili vlastní fork GTK2 s názvem YTK. Ten v únoru letošního roku přestal být volitelným a nově byla zcela odstraněna podpora GTK2.

    Ladislav Hagara | Komentářů: 7
    dnes 11:33 | Nová verze

    Byla vydána nová verze 6.4 linuxové distribuce Parrot OS (Wikipedie). Jedná se o linuxovou distribuci založenou na Debianu a zaměřenou na penetrační testování, digitální forenzní analýzu, reverzní inženýrství, hacking, anonymitu nebo kryptografii. Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    dnes 11:22 | Pozvánky

    Společnost initMAX pořádá sérii bezplatných webinářů věnovaných novému Zabbixu 7.4. Podrobnosti a registrace na webu initMAX.

    … více »
    Heřmi | Komentářů: 0
    dnes 03:44 | Nová verze

    Byla vydána verze 7.0 open source platformy pro správu vlastního cloudu OpenNebula (Wikipedie). Kódový název nové verze je Phoenix. Přehled novinek v poznámkách k vydání v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 1
    dnes 00:11 | Nová verze

    E-mailový klient Thunderbird byl vydán ve verzi 140.0 ESR „Eclipse“. Jde o vydání s dlouhodobou podporou, shrnující novinky v upozorněních, vzhledu, správě složek a správě účtů. Pozor, nezaměňovat s průběžným vydáním 140.0, které bylo dostupné o týden dříve.

    Fluttershy, yay! | Komentářů: 13
    včera 15:11 | IT novinky

    Organizace Video Games Europe reprezentující vydavatele počítačových her publikovala prohlášení k občanské iniciativě Stop Destroying Videogames.

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | IT novinky

    Společnost Raspberry Pi nově nabzí Raspberry Pi Camera Module 3 Sensor Assembly, tj. samostatné senzorové moduly z Raspberry Pi Camera Module 3.

    Ladislav Hagara | Komentářů: 0
    včera 13:00 | Nasazení Linuxu

    Cathode Ray Dude v novém videu ukazuje autorádio Empeg Car (později Rio Car) z let 1999–2001. Šlo o jeden z prvních přehrávačů MP3 do auta. Běží na něm Linux. Vyrobeno bylo jen asi pět tisíc kusů, ale zůstala kolem nich živá komunita, viz např. web riocar.org.

    Fluttershy, yay! | Komentářů: 1
    včera 02:11 | Nová verze

    Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.7.

    Ladislav Hagara | Komentářů: 0
    Jaký je váš oblíbený skriptovací jazyk?
     (60%)
     (27%)
     (7%)
     (2%)
     (1%)
     (1%)
     (3%)
    Celkem 371 hlasů
     Komentářů: 16, poslední 8.6. 21:05
    Rozcestník

    Administrace komentářů

    Jste na stránce určené pro řešení chyb a problémů týkajících se diskusí a komentářů. Můžete zde našim administrátorům reportovat špatně zařazenou či duplicitní diskusi, vulgární či osočující příspěvek a podobně. Děkujeme vám za vaši pomoc, více očí více vidí, společně můžeme udržet vysokou kvalitu AbcLinuxu.cz.

    Příspěvek
    20.8.2006 21:31 Pavel Kysilka
    Rozbalit Rozbalit vše Re: OCR v Linuxu
    zdravim,

    no, to jste dospel k zaveru, co ja s jorc (gocr). bohuzel zadratovana aplikacni logika v aplikaci je mnohdy smrt techto projektu. dal to uz nevyroste.

    co jsem koukal na gocr, tak dodelat heuristiku na hacek nad d,t,n uz je vcelku prusvih. i kdyz je to obracena carka. najednou uz to je nepresne a musite dost kodit.

    osobne ma podle me smysl dela ocr na -nixech timto stylem:

    rozlis nejak radky - vem pismeno - porovnej to s fonty dodanymi z xfont-serveru - a to, co je nepravdepodobnejsi uznej jako vysledne pismeno.

    pripadne nainstaluj dalsi fonty a zpet na stromy.

    ani bych to moc neucil. ty data jiz jsou. pripadne stahnout svg data z unicode.org ci odkud. prusvih jsou arabske a jine cajove fonty.

    jenomze, pokud maji ocr fungovat a prezit v teto dobe, tak pro uzivatele jsou dulezite struktury dat a nejaka metadata. tedy tabulky, obrazky, oramovani. a idealne to cpat do nejakych struktur. ne -li z toho tvorit nejake standart dokumenty typu oasis document.

    cim by se dalo vitezit, je porovnavat 2 formulare ci stejne subjekty a ziskavat tak metadata.

    ocr je vcelku zajimavy byznys. premyslel jsem o tom. i kdyz casem to spise bude o rozpoznavani digitalnich dat typu prevazne text.

    dalsi namet by mozna mohly byt programy pro nevidome anebo aplikace na automaticke testovani desktop veci. kdyz vidim, co se vsechno dava za balast na www stranky, tak uz vcelku uvazuju o vlastni desktop aplikacce na cteni, toho, co chci ja a udelat z www stranky webovou sluzbu. a pouze definovat cesty, co odkud brat.

    pokud by se to melo delat komercne, tak od x-1000 stranek mesicne, by se platilo za stranku, a ne za aplikaci. coz uzivateli s naskenovanou knizkou asi nebude vadit, ale firma to cvakne velmi rada. nebo pronajem vypocetniho vykonu na oplatku.

    ale toto moje postrehy za posledni roky. najednu stranu zajimava uloha. protoze kodeni na relacnich strukturach zacina byt pro me uz vcelku nuda. je otazkou, do ceho se pustit dale.

    bye gf

    goldenfish at bsys dot cz

    V tomto formuláři můžete formulovat svou stížnost ohledně příspěvku. Nejprve vyberte typ akce, kterou navrhujete provést s diskusí či příspěvkem. Potom do textového pole napište důvody, proč by měli admini provést vaši žádost, problém nemusí být patrný na první pohled. Odkaz na příspěvek bude přidán automaticky.

    Vaše jméno
    Váš email
    Typ požadavku
    Slovní popis
    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.