Přihlášení | Registrace

napište » Zprávičky

Zork I, Zork II a Zork III oficiálně open source

dnes 06:11 | Komunita

Microsoft v příspěvku na svém blogu věnovaném open source oznámil, že textové adventury Zork I, Zork II a Zork III (Wikipedie) jsou oficiálně open source pod licencí MIT.

Ladislav Hagara | Komentářů: 0

SUSE Hack Week 25

dnes 05:55 | Komunita

První prosincový týden proběhne SUSE Hack Week 25. Zaměstnanci SUSE mohou věnovat svůj pracovní čas libovolným open source projektům, například přidání AI agenta do Bugzilly, implementaci SSH v programovacím jazyce Zig nebo portaci klasických her na Linux. Připojit se může kdokoli.

Ladislav Hagara | Komentářů: 0

Quick Share na Androidu funguje s AirDropem na iOS

včera 22:00 | IT novinky

Google oznámil, že Quick Share na Androidu funguje s AirDropem na iOS. Zatím na telefonech Pixel 10. Uživatelé tak mohou snadno přenášet soubory z telefonů s Androidem na iPhony a obráceně.

Ladislav Hagara | Komentářů: 1

PHP 8.5

včera 21:22 | Nová verze

Byla vydána nová verze 8.5 (8.5.0) skriptovacího jazyka PHP používaného zejména k vývoji dynamických webových stránek. Přináší řadu novinek a vylepšení (URI Extension, Pipe Operator, Clone With, …). Vydána byla také příručka pro přechod z předchozích verzí.

Ladislav Hagara | Komentářů: 0

EK zahájila vyšetřování cloudových platforem Amazonu a Microsoftu

včera 12:44 | IT novinky

Evropská komise zahájila tři vyšetřování týkající se cloudových platforem Amazon Web Services (AWS) a Microsoft Azure. Evropská exekutiva, která plní také funkci unijního antimonopolního orgánu, chce mimo jiné určit, zda jsou americké společnosti Microsoft a Amazon v cloudových službách takzvanými gatekeepery, tedy hráči, kteří významně ovlivňují provoz internetu a musí dle nařízení o digitálních trzích (DMA) na společném trhu

… více »

Ladislav Hagara | Komentářů: 4

Meta vyhrála soudní spor o převzetí služeb Instagram a WhatsApp

včera 12:33 | IT novinky

Společnost Meta Platforms vyhrála ostře sledovaný spor o akvizici sítě pro sdílení fotografií Instagram a komunikační aplikace WhatsApp. Podle amerického soudu firma jejich převzetím neporušila antimonopolní zákon, protože si tak nemonopolizovala trh sociálních sítí. Žalobu na Metu podala před pěti lety americká Federální obchodní komise (FTC). FTC argumentovala, že Meta, tehdy známá jako Facebook, koupila tyto dvě společnosti v letech 2012 a 2014 proto, aby s nimi nemusela soutěžit.

Ladislav Hagara | Komentářů: 0

Home Assistant Connect ZBT-2

včera 05:11 | IT novinky

Home Assistant včera představil svůj nejnovější oficiální hardware: Home Assistant Connect ZBT-2 pro připojení zařízení na sítích Zigbee nebo Thread.

Ladislav Hagara | Komentářů: 5

Proxmox Virtual Environment 9.1

19.11. 19:44 | Nová verze

Byla vydána verze 9.1 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a informačním videu.

Ladislav Hagara | Komentářů: 1

Superpočítač El Capitan zůstává nejvýkonnějším superpočítačem na světě (TOP500 11/2025)

19.11. 17:44 | IT novinky

Byl aktualizován seznam 500 nejvýkonnějších superpočítačů na světě TOP500. Nejvýkonnějším superpočítačem zůstává El Capitan od HPE (Cray) s výkonem 1,809 exaFLOPS. Druhý Frontier má výkon 1,353 exaFLOPS. Třetí Aurora má výkon 1,012 exaFLOPS. Nejvýkonnější superpočítač v Evropě JUPITER Booster s výkonem 1,000 exaFLOPS je na čtvrtém místě. Nejvýkonnější český superpočítač C24 klesl na 192. místo. Karolina, GPU partition klesla na 224. místo a Karolina, CPU partition na 450. místo. Další přehledy a statistiky na stránkách projektu.

Ladislav Hagara | Komentářů: 17

Azure Cobalt 200

19.11. 17:22 | IT novinky

Microsoft představil Azure Cobalt 200, tj. svůj vlastní SoC (System-on-Chip) postavený na ARM a optimalizovaný pro cloud.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Jaké řešení používáte k vývoji / práci?

Github (35%)

Gitlab (46%)

Atlassian (19%)

Bitbucket (18%)

Gitea (23%)

Mercurial (15%)

jen git (23%)

jen svn (15%)

Jiné (uvedu v diskusi) (17%)

Celkem 376 hlasů

Komentářů: 17, poslední 19.11. 21:57

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / ABBYY FineReader PDF for Mac na Linux

Štítky: For, Linux, mac, OCR, PDF, prohlížeče

Dotaz: ABBYY FineReader PDF for Mac na Linux

22.11.2021 14:56 Jan
ABBYY FineReader PDF for Mac na Linux

Přečteno: 879×

Odpovědět | Admin

Dá sa použiť OCR ABBYY FineReader PDF for Mac na Linux Mint? Dík

Nástroje: Začni sledovat (0) ?

Odpovědi

22.11.2021 16:19 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Mac je nekompatibilní s Linuxem, takže to nepůjde. Proto ostatně existuje i projekt darling, který je něco jako wine, ale na spouštění binárek Macu. Je to ale v zárodku, GUI aplikace údajně nefungují.

Pokud to nutně potřebuješ na Linuxu, tak zkus verzi pro Windows spouštěnou pod wine.
Zdar Max

Měl jsem sen ... :(

22.11.2021 21:06 czjaromir | skóre: 18
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Tak jsem se díval a taky bych doporučil tu verzi pro win spustit pod wine.

22.11.2021 19:23 🇹🇬 | skóre: 37 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

maj tam nějakou trial verzi hele tak to mužeš zkusit ale asi ti to nepojede :O :O

stasi se probouzí 🕵️🇩🇪 indové říděj🚚🇮🇳 plavba🍉🛶

22.11.2021 22:35 Want
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Proč? Linux má k dispozici lepší nástroje.

24.11.2021 09:25 -nd-
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Nejvíc spokojenej jsem s tesseract.

24.11.2021 19:10 Vit
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

No jenze Abbyy funguje na 90% a s Tesseract dam stezi 60%. A to pritom parsuji scany starych textu z T602 editoru, tedy pomerne dobre citelne. Proste na OCR opensource durazne nedoporucuji, tam jde o kvalitu.

24.11.2021 19:23 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

T602 mal veľmi jednoduchý textový formát, ale v dobe jeho kraľovania sa tlačil na ihličkovej tlačiarni aj keď s obmedzeným množstvom fontov. Odporučil by som znížiť rozlíšenie skenovania, ak nie sú zdrojové súbory k dispozícii.

25.11.2021 08:59 Want
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Odporučil by som znížiť rozlíšenie skenovania, ak nie sú zdrojové súbory k dispozícii.

Předpokládanám, že jsi to radil především kvůli tomu, aby se tečky slily, jinak je to pouze cesta, jak ztratit další procento obrazové informace.

Správná cesta je získat co nejlepší sken, a pak laborovat s postprocessingem.

25.11.2021 18:24 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Áno, samozrejme. Keď som skenoval obyčajné časopisy (ofsetová tlač), tak sa pri príliž veľkom rozlíšení nechytalo OCR. Keď som to dal na nižšie, tak to fungovalo v pohode.

Ak skenuje niečo z ihličkovej tlačiarne, tak bude na tom podobne. Len rozlíšenie bude musieť byť ešte menšie nech na tom nepohorí OCR.

25.11.2021 18:49 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Len rozlíšenie bude musieť byť ešte menšie nech na tom nepohorí OCR

Je to cesta, ale nikoliv nezbytně nutná. Během postprocessingu se to dá vyřešit filtrem co rozmázne skvrny podle barvy tím pádem lze cíleně „slít” pouze ty tečky. Pak už si s tím OCR poradí. Největší blbost je, tyhle materiály skenovat černobíle, nebo ve stupních šedi. Nejrychlejší je to mastit foťákem.

25.11.2021 19:16 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Ten foťák to obvykle rozmaže aj sám, a zleje to do machule. Holt, výstup z 20Mpix pinole kamery s výstupom jpeg vyzerá ako fotka len do rozmeru pohľadnice. Ale je to najjednoduchšie riešenie na malý objem papiera pre digitalizáciu.

24.11.2021 19:57 Pavel 'TIGER' Růžička | skóre: 54
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Nebyla by nějaká zkušební stránka?

25.11.2021 07:20 Vit
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Bohuzel jsou to pravni a soudni materialy s razitkem duverne ci tajne :-)

Vetsina originalu byla tisknuta 24 jehlickovymi tiskarnami, novejsi laserovkou, nektere jsou fotokopie. S kvalitou scanu fakt problem neni, zabyvam se tim uz snad 2 roky. Jde o software. Abbyy je kralem, predtim se jeste pouzivala Recognita. Zadny opensource se kvalitou OCR k temto nepriblizil.

25.11.2021 07:46 Want
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Já se tím zabývám 20 let, takže si troufám říct, že tomu pořádně nerozumíš. A používat na tyhle materiály PDF je pitomost.

25.11.2021 14:48 Vit
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Ja nikde netvrdim ze pouzivame jen pdf :-)

To mozna puvodni tazatel. Jak poznamenava Alesuv prispevek DjVu ma nejake vychytavky navic, hlavne velikost je zajimava. Vysledek ukladame:

pdf (searchable, s txt vrstvou, podpis) - bezne pouziti klientem
djvu (taky s txt vrstvou, timestampy, verzionovani, podpis) - archiv a machine learning
originalni scany (tiff, png) s OCR txt, html... proste co pandoc da - archiv, pro digitalni arecheology kdyby v budoucnu prisel nejaky lepsi format ci korekce chyb

25.11.2021 15:25 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

8-D To byl můj příspěvek, který jsem psal na mobilu. Ale jak jsem napsal jen o kousek níže. Výsledek OCR hodně ovlivňuje postprocessing. Proto je také můj výsledek OCR (používám výhradně opensource) poměrně kvalitní. U DjVu ho totiž pouštím na vrstvu popředí, kde je pozadí s nejrůznějším bordelem už odfiltrované.

Další věc je, že vyrábím DjVu přes svůj nástroj djvutool, a přes volbu algoritmu a dalších parametrů mohu výsledek dost výrazně ovlivnit.

V minulosti jsem používal i zmíněné balíky pro win prostředí. Podle mne už dávno zastaraly. V linuxovém prostředí je výborný nástroj pro zpracování PDF, který podporuje i OCR Master PDF Editor, který využívá právě tesseract. Dokonce má i nějakou podporu učení.

Já toho moc nevyužívám. Stránky na které pouštím OCR to většinou neopotřebují. Přeci jenom těch textů není zas tolik. Jen sem tam nějaká knížka. Ale jak jsem napsal, 20 let zkušeností.

25.11.2021 09:29 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Kdyby tě to zajímalo, tak před 3 lety jsem si zpracoval do jednoho DjVu všechny Denní situační zprávy FMV, z webu Ústavu pro studium totalitních režimů, což jsou asi podobné materiály, s jakými pracuješ ty.

Bohužel jsem neměl k dispozici originální skeny, takže jsem musel vyjít již z těch PDF souborů, proto má ten výsledný soubor, ve kterém je pohromadě všech 5401 stránek, 194MB – včetně textové vrstvy. A to byl také důvod proč jsem to dělal. V těch originálních PDF žádná textová vrstva není a já chtěl mít možnost fulltextového vyhledávání. Netvrdím, že můj výsledek má 100% rozpoznání celého obsahu, ale těch 99,5% to bude. Nehledě na to, že pokud by někdo moc chtěl, optava textové vrstvy není složitá.

Ovšem ten hlavním důvod, proč je na tohle DjVu lepší než PDF je ten, že lze do souboru vložit kontrolní součty všech vrstev, podepsané důvěryhodným certifikátem, takže je prakticky vyloučeno dodatečné zfixlování obrazové informace.

25.11.2021 10:33 Love_Dali | skóre: 24
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

děkuju za zajímavej link :)

25.11.2021 13:17 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Ovšem ten hlavním důvod, proč je na tohle DjVu lepší než PDF je ten, že lze do souboru vložit kontrolní součty všech vrstev, podepsané důvěryhodným certifikátem, takže je prakticky vyloučeno dodatečné zfixlování obrazové informace.

Zatímco v PDF můžete podepsat verzi dokumentu důvěryhodným certifikátem, pak přidat novou verzi s textovou vrstvou (novou verzi můžete případně také podepsat). A pak můžete přidávat další verze s úpravami textové vrstvy. Takže je prakticky vyloučeno dodatečné zfixlování obrazové informace. V čem je tedy rozdíl oproti DjVu?

25.11.2021 13:37 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Především v rychlosti práce s dokumentem a velikosti.

Zatímco v PDF můžete podepsat verzi dokumentu důvěryhodným certifikátem, pak přidat novou verzi s textovou vrstvou (novou verzi můžete případně také podepsat). A pak můžete přidávat další verze s úpravami textové vrstvy.

Přiznám se, že zrovna tomuto moc nerozumím. Vím jak vypadá PDF a není mi jasné proč by měla být verzována zrovna textová vrstva, která má za cíl usnadnit vyhledání informace v obrazové vrstvě.

Z DjVu dokumentu nikdy nelze vyrobit dokument, který by bylo možné zaměnit s originálem. To v prvé řadě. Je technicky nemožné, z něj vytáhnout obrazovou vrstvu a dodatečně do ní vlepit něco jiného. Což u PDF neplatí. A pokud to PDF bude falšovat osoba s přístupem k důvěryhodnému certifikátu, neodhalíte nic.

DjVu formát navíc umožňuje vlepit i originální sken v jpeg2000. Prakticky se to ale nedělá. Prohlížeče s tím nepočítají a výsledný soubor by byl moc velký, takže např. archive.org udržuje originální skeny v tomhle formátu v samostatných archivech.

25.11.2021 20:21 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Pokud má někdo privátní klíč k tomu certifikátu, může si vyrobit a podepsat jakýkoli soubor, i ve formátu DjVu. Jenom mne zajímalo, zda DjVu umí z hlediska zabezpečení obsahu něco, co PDF neumí – původní komentář tak vyzněl. Takže neumí. To mi stačí.

25.11.2021 20:55 Want
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Kontrolní součet není certifikát.

25.11.2021 21:12 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Není. Já i Aleš Kapica ovšem píšeme o podpisu, který je založený na certifikátu.

25.11.2021 22:44 Want
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Jenže já měl na mysli certifikátem podepsaný seznam kontrolních součtů. DjVu sice má i secure variantu, ale ta nebyla nikdy opensource a je prakticky mrtvá.

2.12.2021 07:39 -nd-
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Teď vyšla 5

https://github.com/tesseract-ocr/tesseract/releases/tag/5.0.0

2.12.2021 20:22 User682 | skóre: 38 | blog: aqarium | Praha
Rozbalit Rozbalit vše Re: ABBYY FineReader PDF for Mac na Linux

Nemam ozkouseno a to na ABBY SW delam.

Jednu dobu jsme ale uvazovali o ABBYY CLI OCR for Linux, ale ted to vypada, ze se vse tlaci do cloudu. S tim, ze nejake GUI nastroje pouze na Windows.

Hodne me prekvapil Tesseract 4 a 5. Ale porad to ma nejake mouchy.

Zauvazoval bych o Amazon OCR v cloudu. Provolat nejake webservice a dostat z toho data. Ceny byly nekde 10 haleeru za stranku ci neco podobneho, kdyz jsem to studoval.

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje