abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 21:22 | IT novinky

    CEO Twitteru Jack Dorsey odstoupil. S okamžitou platností se novým CEO stal Parag Agrawal.

    Ladislav Hagara | Komentářů: 3
    včera 17:09 | IT novinky

    Dnes je Cyber Monday, kdy je možné u Codeweavers zakoupit CrossOver (komerční implementaci Wine) se slevou 25% (unlimited) nebo 75% (roční). Slevy jsou limitovány počtem kupujících.

    Max | Komentářů: 2
    28.11. 21:55 | Komunita

    Dne 26. 11. 2021 nás ve věku 49 let navždy opustil spoluzakladatel KERNEL ULTRAS a tvůrce mnoha projektů Mário Chorváth, alias Bedňa. Tato smutná zpráva byla bez dalších podrobností oznámena rodinou na jeho FB profilu.

    =^..^= AmigaPower® | Komentářů: 28
    28.11. 12:44 | Nová verze

    Vyšla verze 6.0 verzovacího systému Mercurial. Novinky jsou shrnuty v poznámkách k vydání. Jde o poslední verzi, která podporuje Python 2.x. Nejpodstatnější změnou je nová verze dirstate (vnitřních struktur), díky čemuž by se měly zrychlit některé operace (commit, diff apod.) a dále je možné ukládat k souborům víc metainformací.

    finn | Komentářů: 10
    27.11. 17:33 | Komunita

    O víkendu probíhá EmacsConf 2021, tj. online konference vývojářů a uživatelů editoru GNU Emacs. Sledovat lze na stránkách konference nebo také na YouTube.

    Ladislav Hagara | Komentářů: 3
    26.11. 23:55 | Nová verze

    Heimer je v Qt napsaná desktopová aplikace pro tvorbu myšlenkových map, diagramů a poznámek. Vydána byla verze 3.0.0. Videoukázka verze 1.9.0 na YouTube.

    Ladislav Hagara | Komentářů: 9
    26.11. 17:11 | Zajímavý projekt

    Na stránkách LINux on MOBile je každou středu publikován týdenní přehled dění kolem Linuxu na mobilních zařízeních. V aktuálním přehledu je zmíněn například nový build 2021/11/21 Arch Linuxu ARM pro PinePhone a PineTab nebo NemoMobile 0.7.

    Ladislav Hagara | Komentářů: 0
    25.11. 21:11 | Komunita

    Mozilla ukončí podporu aplikace Firefox Lockwise pro systémy Android a iOS s účinností od 13. prosince 2021. Aplikaci Firefox Lockwise již nebude možné nainstalovat ani přeinstalovat z obchodu App Store ani Google Play.

    Ladislav Hagara | Komentářů: 9
    25.11. 20:22 | Nová verze

    Byla vydána verze 8.1.0 skriptovacího jazyka PHP používaného zejména k vývoji dynamických webových stránek. Přináší řadu novinek a vylepšení. Vydána byla také příručka pro přechod z předchozích verzí.

    Ladislav Hagara | Komentářů: 0
    25.11. 08:00 | Nová verze

    Endless OS byl vydán ve verzi 4.0.0. Přehled novinek v poznámkách k vydání. Nejnovější Endless OS vychází z Debianu Bullseye. Zdůrazněna je dlouhodobá podpora.

    Ladislav Hagara | Komentářů: 0
    Který formát počítače (form factor) preferujete?
     (15%)
     (33%)
     (7%)
     (39%)
     (6%)
    Celkem 421 hlasů
     Komentářů: 46, poslední 24.11. 15:31
    Rozcestník



    Dotaz: ABBYY FineReader PDF for Mac na Linux

    22.11. 14:56 Jan
    ABBYY FineReader PDF for Mac na Linux
    Přečteno: 508×
    Dá sa použiť OCR ABBYY FineReader PDF for Mac na Linux Mint? Dík

    Odpovědi

    Max avatar 22.11. 16:19 Max | skóre: 69 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Mac je nekompatibilní s Linuxem, takže to nepůjde. Proto ostatně existuje i projekt darling, který je něco jako wine, ale na spouštění binárek Macu. Je to ale v zárodku, GUI aplikace údajně nefungují.

    Pokud to nutně potřebuješ na Linuxu, tak zkus verzi pro Windows spouštěnou pod wine.
    Zdar Max
    Měl jsem sen ... :(
    22.11. 21:06 czjaromir | skóre: 10
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Tak jsem se díval a taky bych doporučil tu verzi pro win spustit pod wine.
    Gréta avatar 22.11. 19:23 Gréta | skóre: 34 | blog: Grétin blogísek | Stockholm
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

    maj tam nějakou trial verzi hele tak to mužeš zkusit ale asi ti to nepojede :O :O

    22.11. 22:35 Want
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Proč? Linux má k dispozici lepší nástroje.
    24.11. 09:25 -nd-
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Nejvíc spokojenej jsem s tesseract.
    24.11. 19:10 Vit
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    No jenze Abbyy funguje na 90% a s Tesseract dam stezi 60%. A to pritom parsuji scany starych textu z T602 editoru, tedy pomerne dobre citelne. Proste na OCR opensource durazne nedoporucuji, tam jde o kvalitu.
    24.11. 19:23 Peter Golis | skóre: 62 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    T602 mal veľmi jednoduchý textový formát, ale v dobe jeho kraľovania sa tlačil na ihličkovej tlačiarni aj keď s obmedzeným množstvom fontov. Odporučil by som znížiť rozlíšenie skenovania, ak nie sú zdrojové súbory k dispozícii.
    25.11. 08:59 Want
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Odporučil by som znížiť rozlíšenie skenovania, ak nie sú zdrojové súbory k dispozícii.
    Předpokládanám, že jsi to radil především kvůli tomu, aby se tečky slily, jinak je to pouze cesta, jak ztratit další procento obrazové informace.

    Správná cesta je získat co nejlepší sken, a pak laborovat s postprocessingem.
    25.11. 18:24 Peter Golis | skóre: 62 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Áno, samozrejme. Keď som skenoval obyčajné časopisy (ofsetová tlač), tak sa pri príliž veľkom rozlíšení nechytalo OCR. Keď som to dal na nižšie, tak to fungovalo v pohode.

    Ak skenuje niečo z ihličkovej tlačiarne, tak bude na tom podobne. Len rozlíšenie bude musieť byť ešte menšie nech na tom nepohorí OCR.
    25.11. 18:49 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Len rozlíšenie bude musieť byť ešte menšie nech na tom nepohorí OCR
    Je to cesta, ale nikoliv nezbytně nutná. Během postprocessingu se to dá vyřešit filtrem co rozmázne skvrny podle barvy tím pádem lze cíleně „slít” pouze ty tečky. Pak už si s tím OCR poradí. Největší blbost je, tyhle materiály skenovat černobíle, nebo ve stupních šedi. Nejrychlejší je to mastit foťákem.
    25.11. 19:16 Peter Golis | skóre: 62 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Ten foťák to obvykle rozmaže aj sám, a zleje to do machule. Holt, výstup z 20Mpix pinole kamery s výstupom jpeg vyzerá ako fotka len do rozmeru pohľadnice. Ale je to najjednoduchšie riešenie na malý objem papiera pre digitalizáciu.
    Pavel 'TIGER' Růžička avatar 24.11. 19:57 Pavel 'TIGER' Růžička | skóre: 52
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Nebyla by nějaká zkušební stránka?
    25.11. 07:20 Vit
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Bohuzel jsou to pravni a soudni materialy s razitkem duverne ci tajne :-) Vetsina originalu byla tisknuta 24 jehlickovymi tiskarnami, novejsi laserovkou, nektere jsou fotokopie. S kvalitou scanu fakt problem neni, zabyvam se tim uz snad 2 roky. Jde o software. Abbyy je kralem, predtim se jeste pouzivala Recognita. Zadny opensource se kvalitou OCR k temto nepriblizil.
    25.11. 07:46 Want
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Já se tím zabývám 20 let, takže si troufám říct, že tomu pořádně nerozumíš. A používat na tyhle materiály PDF je pitomost.
    25.11. 14:48 Vit
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Ja nikde netvrdim ze pouzivame jen pdf :-) To mozna puvodni tazatel. Jak poznamenava Alesuv prispevek DjVu ma nejake vychytavky navic, hlavne velikost je zajimava. Vysledek ukladame:
    • pdf (searchable, s txt vrstvou, podpis) - bezne pouziti klientem
    • djvu (taky s txt vrstvou, timestampy, verzionovani, podpis) - archiv a machine learning
    • originalni scany (tiff, png) s OCR txt, html... proste co pandoc da - archiv, pro digitalni arecheology kdyby v budoucnu prisel nejaky lepsi format ci korekce chyb
    25.11. 15:25 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    8-D To byl můj příspěvek, který jsem psal na mobilu. Ale jak jsem napsal jen o kousek níže. Výsledek OCR hodně ovlivňuje postprocessing. Proto je také můj výsledek OCR (používám výhradně opensource) poměrně kvalitní. U DjVu ho totiž pouštím na vrstvu popředí, kde je pozadí s nejrůznějším bordelem už odfiltrované.

    Další věc je, že vyrábím DjVu přes svůj nástroj djvutool, a přes volbu algoritmu a dalších parametrů mohu výsledek dost výrazně ovlivnit.

    V minulosti jsem používal i zmíněné balíky pro win prostředí. Podle mne už dávno zastaraly. V linuxovém prostředí je výborný nástroj pro zpracování PDF, který podporuje i OCR Master PDF Editor, který využívá právě tesseract. Dokonce má i nějakou podporu učení.

    Já toho moc nevyužívám. Stránky na které pouštím OCR to většinou neopotřebují. Přeci jenom těch textů není zas tolik. Jen sem tam nějaká knížka. Ale jak jsem napsal, 20 let zkušeností.
    25.11. 09:29 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Kdyby tě to zajímalo, tak před 3 lety jsem si zpracoval do jednoho DjVu všechny Denní situační zprávy FMV, z webu Ústavu pro studium totalitních režimů, což jsou asi podobné materiály, s jakými pracuješ ty.

    Bohužel jsem neměl k dispozici originální skeny, takže jsem musel vyjít již z těch PDF souborů, proto má ten výsledný soubor, ve kterém je pohromadě všech 5401 stránek, 194MB – včetně textové vrstvy. A to byl také důvod proč jsem to dělal. V těch originálních PDF žádná textová vrstva není a já chtěl mít možnost fulltextového vyhledávání. Netvrdím, že můj výsledek má 100% rozpoznání celého obsahu, ale těch 99,5% to bude. Nehledě na to, že pokud by někdo moc chtěl, optava textové vrstvy není složitá.

    Ovšem ten hlavním důvod, proč je na tohle DjVu lepší než PDF je ten, že lze do souboru vložit kontrolní součty všech vrstev, podepsané důvěryhodným certifikátem, takže je prakticky vyloučeno dodatečné zfixlování obrazové informace.
    25.11. 10:33 Love_Dali | skóre: 24
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    děkuju za zajímavej link :)
    25.11. 13:17 Filip Jirsák | skóre: 68 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Ovšem ten hlavním důvod, proč je na tohle DjVu lepší než PDF je ten, že lze do souboru vložit kontrolní součty všech vrstev, podepsané důvěryhodným certifikátem, takže je prakticky vyloučeno dodatečné zfixlování obrazové informace.
    Zatímco v PDF můžete podepsat verzi dokumentu důvěryhodným certifikátem, pak přidat novou verzi s textovou vrstvou (novou verzi můžete případně také podepsat). A pak můžete přidávat další verze s úpravami textové vrstvy. Takže je prakticky vyloučeno dodatečné zfixlování obrazové informace. V čem je tedy rozdíl oproti DjVu?
    25.11. 13:37 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Především v rychlosti práce s dokumentem a velikosti.
    Zatímco v PDF můžete podepsat verzi dokumentu důvěryhodným certifikátem, pak přidat novou verzi s textovou vrstvou (novou verzi můžete případně také podepsat). A pak můžete přidávat další verze s úpravami textové vrstvy.
    Přiznám se, že zrovna tomuto moc nerozumím. Vím jak vypadá PDF a není mi jasné proč by měla být verzována zrovna textová vrstva, která má za cíl usnadnit vyhledání informace v obrazové vrstvě.

    Z DjVu dokumentu nikdy nelze vyrobit dokument, který by bylo možné zaměnit s originálem. To v prvé řadě. Je technicky nemožné, z něj vytáhnout obrazovou vrstvu a dodatečně do ní vlepit něco jiného. Což u PDF neplatí. A pokud to PDF bude falšovat osoba s přístupem k důvěryhodnému certifikátu, neodhalíte nic.

    DjVu formát navíc umožňuje vlepit i originální sken v jpeg2000. Prakticky se to ale nedělá. Prohlížeče s tím nepočítají a výsledný soubor by byl moc velký, takže např. archive.org udržuje originální skeny v tomhle formátu v samostatných archivech.
    25.11. 20:21 Filip Jirsák | skóre: 68 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Pokud má někdo privátní klíč k tomu certifikátu, může si vyrobit a podepsat jakýkoli soubor, i ve formátu DjVu. Jenom mne zajímalo, zda DjVu umí z hlediska zabezpečení obsahu něco, co PDF neumí – původní komentář tak vyzněl. Takže neumí. To mi stačí.
    25.11. 20:55 Want
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Kontrolní součet není certifikát.
    25.11. 21:12 Filip Jirsák | skóre: 68 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Není. Já i Aleš Kapica ovšem píšeme o podpisu, který je založený na certifikátu.
    25.11. 22:44 Want
    Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux
    Jenže já měl na mysli certifikátem podepsaný seznam kontrolních součtů. DjVu sice má i secure variantu, ale ta nebyla nikdy opensource a je prakticky mrtvá.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.