abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 13:22 | IT novinky

    Společnost ARM představila platformu Arm Lumex s Arm C1 CPU Cluster a Arm Mali G1-Ultra GPU pro vlajkové chytré telefony a počítače nové generace.

    Ladislav Hagara | Komentářů: 0
    dnes 05:44 | Nová verze

    Unicode Consortium, nezisková organizace koordinující rozvoj standardu Unicode, oznámila vydání Unicode 17.0. Přidáno bylo 4 803 nových znaků. Celkově jich je 159 801. Přibylo 7 nových Emoji.

    Ladislav Hagara | Komentářů: 0
    včera 21:00 | IT novinky Ladislav Hagara | Komentářů: 6
    včera 18:33 | Nová verze

    Realtimová strategie Warzone 2100 (Wikipedie) byla vydána ve verzi 4.6.0. Podrobný přehled novinek, změn a oprav v ChangeLogu na GitHubu. Nejnovější verzi Warzone 2100 lze již instalovat také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 2
    včera 12:22 | IT novinky

    Polské vývojářské studio CD Projekt Red publikovalo na Printables.com 3D modely z počítačové hry Cyberpunk 2077.

    Ladislav Hagara | Komentářů: 0
    včera 11:44 | Pozvánky

    Organizátoři konference LinuxDays 2025 vydali program a zároveň otevřeli registrace. Akce se uskuteční 4. a 5. října na FIT ČVUT v pražských Dejvicích, kde vás čekají přednášky, workshopy, stánky a spousta šikovných lidí. Vstup na akci je zdarma.

    Petr Krčmář | Komentářů: 6
    8.9. 22:00 | IT novinky

    Uživatelé komunikátoru Signal si mohou svá data přímo v Signalu bezpečně zálohovat a v případě rozbití nebo ztráty telefonu následně na novém telefonu obnovit. Zálohování posledních 45 dnů je zdarma. Nad 45 dnů je zpoplatněno částkou 1,99 dolaru měsíčně.

    Ladislav Hagara | Komentářů: 0
    8.9. 18:44 | Zajímavý článek

    Server Groklaw, zaměřený na kauzy jako právní spory SCO týkající se Linuxu, skončil před 12 lety, resp. doména stále existuje, ale web obsahuje spam propagující hazardní hry. LWN.net proto v úvodníku připomíná důležitost zachovávání komunitních zdrojů a upozorňuje, že Internet Archive je také jen jeden.

    🇵🇸 | Komentářů: 20
    8.9. 14:22 | Nová verze

    Jakub Vrána vydal Adminer ve verzi 5.4.0: "Delší dobu se v Admineru neobjevila žádná závažná chyba, tak jsem nemusel vydávat novou verzi, až počet změn hodně nabobtnal."

    Ladislav Hagara | Komentářů: 3
    8.9. 13:22 | IT novinky

    V Německu slavnostně uvedli do provozu (en) nejrychlejší počítač v Evropě. Superpočítač Jupiter se nachází ve výzkumném ústavu v Jülichu na západě země, podle německého kancléře Friedricha Merze otevírá nové možnosti pro trénování modelů umělé inteligence (AI) i pro vědecké simulace. Superpočítač Jupiter je nejrychlejší v Evropě a čtvrtý nejrychlejší na světě (TOP500). „Chceme, aby se z Německa stal národ umělé inteligence,“ uvedl na

    … více »
    Ladislav Hagara | Komentářů: 21
    Pro otevření více webových stránek ve webovém prohlížečí používám
     (83%)
     (7%)
     (2%)
     (3%)
     (4%)
     (2%)
    Celkem 160 hlasů
     Komentářů: 12, poslední dnes 13:00
    Rozcestník

    Dotaz: OCR a PDF s textovou vrstvou

    27.6.2019 07:37 jsk | skóre: 10
    OCR a PDF s textovou vrstvou
    Přečteno: 686×
    Zdravím,
    potřebuji protáhnout jednotky tisíc stran nafoceného textu (anj, welšina gaelština) přes OCR. Ve výsledku potřebuji PDF s textovou vrstvou. ABBYY FineReader je fakt skvělý, ale cena pro jednorázové použití je fakt značná.
    Nevíte o finančně přístupnějším řešení, děkuji.
    Pepa

    Odpovědi

    27.6.2019 08:13 Monika Kokešová | skóre: 4 | blog: Kokeshka
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    Nedávno tu o tom byla zprávička: Full-textové prohledávání komiksů a jiných obrázků. Tzn. OCR Tesseract.
    27.6.2019 11:53 mpx
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    .... mozno usetrim cas na hladanie

    tu sa da "odrazit" na tesseract

    https://github.com/tesseract-ocr/tesseract/wiki/User-Projects-%E2%80%93-3rdParty

    pouzil som "Linux-Intelligent-OCR-Solution(lios" na Manjaro

    ja som spokojny
    27.6.2019 11:56 mhepp
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    scantailor na „vyčištění“ skenovaných obrázků a ocrmypdf na doplnění textové vrstvy.
    27.6.2019 12:56 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    Ve výsledku potřebuji PDF s textovou vrstvou.
    Fujtajxl.

    Já to dělám takhle. Protože si tu vrstvu pak můžu poeditovat, vyházet nesmysly a opravit špatně rozeznané texty.
    27.6.2019 13:00 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    Protože si tu vrstvu pak můžu poeditovat, vyházet nesmysly a opravit špatně rozeznané texty.
    Jo, protoze to v Acrobatu nejde...
    27.6.2019 17:38 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    Closed source mě nezajímá.
    28.6.2019 02:30 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    PDF specifikace je otevrena a hromada OSS nastroju take existuje.
    28.6.2019 07:12 Want
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    O těch jsi ale nepsal. PDF s textovou vrstvou je bastl. Bohužel se pod tou zkratkou skrývá několik různých typů dokumentů, které většina uživatelů není schopna rozlišovat, jako v dobách modemů.

    Jenže tady nejde o data. DjVu je pro zpracování přes OCR vhodnější, protože je-li dokument udělaný správně, má odseparovanou vrstvu vrstvu popředí, ve které je většinou text, což výrazně zvyšuje úspěšnost OCR.

    Navíc jeho textová vrstva je navržena tak, že může obsahovat nejenom originální text, ale i jeho překlady. A textovou vrstvu lze doplnit i u dokumentů, které přes OCR nikdy nezvládne, jako jsou např. rukopisy atp.
    28.6.2019 07:17 Want
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    Naopak udělat PDF s textovou vrstvou, jak to chce tazatel, je z DjVu dokumentu brnkačka. DjVu totiž může mít i vrstvu ve které je originální sken v JPEG-2000. Takže je technicky možné udělat takový dokument i bez ztráty kvality obrazu.
    Jendа avatar 27.6.2019 16:39 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    27.6.2019 17:05 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    ABBYY FineReader má i online řešení, ale v porovnání s verzí Standard moc neušetříte. Ale služeb „online OCR“ je spousta.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.