abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 04:00 | Nová verze

    raylib (Wikipedie), tj. multiplatformní open-source knihovna pro vývoj grafických aplikací a her, byla vydána ve verzi 6.0.

    Ladislav Hagara | Komentářů: 0
    24.4. 18:33 | IT novinky

    Nové verze AI modelů. Společnost OpenAI představila GPT‑5.5. Společnost DeepSeek představila DeepSeek V4.

    Ladislav Hagara | Komentářů: 0
    24.4. 15:33 | Zajímavý článek

    Nová čísla časopisů od nakladatelství Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 164 (pdf) a Hello World 29 (pdf).

    Ladislav Hagara | Komentářů: 0
    24.4. 04:44 | Komunita

    Bylo oznámeno, že webový prohlížeč Opera GX zaměřený na hráče počítačových her je už také na Flathubu and Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    23.4. 23:11 | IT novinky

    Akcionáři americké mediální společnosti Warner Bros. Discovery dnes schválili převzetí firmy konkurentem Paramount Skydance za zhruba 110 miliard dolarů (téměř 2,3 bilionu Kč). Firmy se na spojení dohodly v únoru. O část společnosti Warner Bros. Discovery dříve usilovala rovněž streamovací platforma Netflix, se svou nabídkou však neuspěla. Transakci ještě budou schvalovat regulační orgány, a to nejen ve Spojených státech, ale také

    … více »
    Ladislav Hagara | Komentářů: 0
    23.4. 22:33 | Nová verze

    Canonical vydal (email, blog, YouTube) Ubuntu 26.04 LTS Resolute Raccoon. Přehled novinek v poznámkách k vydání. Vydány byly také oficiální deriváty Edubuntu, Kubuntu, Lubuntu, Ubuntu Budgie, Ubuntu Cinnamon, Ubuntu Kylin, Ubuntu Studio, Ubuntu Unity a Xubuntu. Jedná se o 11. vydání s dlouhodobou podporou (LTS).

    Ladislav Hagara | Komentářů: 2
    23.4. 11:55 | Nová verze

    V programovacím jazyce Go naprogramovaná webová aplikace pro spolupráci na zdrojových kódech pomocí gitu Gitea (Wikipedie) byla vydána v nové verzi 1.26.0. Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    23.4. 04:44 | Pozvánky

    Ve středu 29. dubna 2026 se v pražské kanceláři SUSE v Karlíně uskuteční 7. Mobile Linux Hackday, komunitní setkání zaměřené na Linux na mobilních zařízeních, kernelový vývoj i uživatelský prostor. Akce proběhne od 10:00 do večerních hodin. Hackday je určen všem zájemcům o praktickou práci s Linuxem na telefonech. Zaměří se na vývoj aplikací v userspace, například bankovní aplikace, zpracování obrazu z kamery nebo práci s NFC, i na úpravy

    … více »
    lkocman | Komentářů: 1
    22.4. 21:55 | Nová verze

    LilyPond (Wikipedie) , tj. multiplatformní svobodný software určený pro sazbu notových zápisů, byl vydán ve verzi 2.26.0. Přehled novinek v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 0
    22.4. 20:33 | Nová verze

    Byla vydána nová verze 11.0.0 otevřeného emulátoru procesorů a virtualizačního nástroje QEMU (Wikipedie). Přispělo 237 vývojářů. Provedeno bylo více než 2 500 commitů. Přehled úprav a nových vlastností v seznamu změn.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (8%)
     (2%)
     (13%)
     (31%)
     (3%)
     (6%)
     (2%)
     (15%)
     (25%)
    Celkem 1420 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Dotaz: OCR a PDF s textovou vrstvou

    27.6.2019 07:37 jsk | skóre: 10
    OCR a PDF s textovou vrstvou
    Přečteno: 731×
    Zdravím,
    potřebuji protáhnout jednotky tisíc stran nafoceného textu (anj, welšina gaelština) přes OCR. Ve výsledku potřebuji PDF s textovou vrstvou. ABBYY FineReader je fakt skvělý, ale cena pro jednorázové použití je fakt značná.
    Nevíte o finančně přístupnějším řešení, děkuji.
    Pepa

    Odpovědi

    27.6.2019 08:13 Monika Kokešová | skóre: 4 | blog: Kokeshka
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    Nedávno tu o tom byla zprávička: Full-textové prohledávání komiksů a jiných obrázků. Tzn. OCR Tesseract.
    27.6.2019 11:53 mpx
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    .... mozno usetrim cas na hladanie

    tu sa da "odrazit" na tesseract

    https://github.com/tesseract-ocr/tesseract/wiki/User-Projects-%E2%80%93-3rdParty

    pouzil som "Linux-Intelligent-OCR-Solution(lios" na Manjaro

    ja som spokojny
    27.6.2019 11:56 mhepp
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    scantailor na „vyčištění“ skenovaných obrázků a ocrmypdf na doplnění textové vrstvy.
    27.6.2019 12:56 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    Ve výsledku potřebuji PDF s textovou vrstvou.
    Fujtajxl.

    Já to dělám takhle. Protože si tu vrstvu pak můžu poeditovat, vyházet nesmysly a opravit špatně rozeznané texty.
    27.6.2019 13:00 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    Protože si tu vrstvu pak můžu poeditovat, vyházet nesmysly a opravit špatně rozeznané texty.
    Jo, protoze to v Acrobatu nejde...
    27.6.2019 17:38 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    Closed source mě nezajímá.
    28.6.2019 02:30 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    PDF specifikace je otevrena a hromada OSS nastroju take existuje.
    28.6.2019 07:12 Want
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    O těch jsi ale nepsal. PDF s textovou vrstvou je bastl. Bohužel se pod tou zkratkou skrývá několik různých typů dokumentů, které většina uživatelů není schopna rozlišovat, jako v dobách modemů.

    Jenže tady nejde o data. DjVu je pro zpracování přes OCR vhodnější, protože je-li dokument udělaný správně, má odseparovanou vrstvu vrstvu popředí, ve které je většinou text, což výrazně zvyšuje úspěšnost OCR.

    Navíc jeho textová vrstva je navržena tak, že může obsahovat nejenom originální text, ale i jeho překlady. A textovou vrstvu lze doplnit i u dokumentů, které přes OCR nikdy nezvládne, jako jsou např. rukopisy atp.
    28.6.2019 07:17 Want
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    Naopak udělat PDF s textovou vrstvou, jak to chce tazatel, je z DjVu dokumentu brnkačka. DjVu totiž může mít i vrstvu ve které je originální sken v JPEG-2000. Takže je technicky možné udělat takový dokument i bez ztráty kvality obrazu.
    Jendа avatar 27.6.2019 16:39 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    27.6.2019 17:05 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: OCR a PDF s textovou vrstvou
    ABBYY FineReader má i online řešení, ale v porovnání s verzí Standard moc neušetříte. Ale služeb „online OCR“ je spousta.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.