abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 01:44 | Komunita

    Spotify prostřednictvím svého FOSS fondu rozdělilo 70 000 eur mezi tři open source projekty: FFmpeg obdržel 30 000 eur, Mock Service Worker (MSW) obdržel 15 000 eur a Xiph.Org Foundation obdržela 25 000 eur.

    Ladislav Hagara | Komentářů: 1
    včera 18:11 | Zajímavý software

    Nazdar! je open source počítačová hra běžící také na Linuxu. Zdrojové kódy jsou k dispozici na GitHubu. Autorem je Michal Škoula.

    Ladislav Hagara | Komentářů: 0
    včera 16:55 | Nová verze

    Po více než třech letech od vydání verze 1.4.0 byla vydána nová verze 1.5.0 správce balíčků GNU Guix a na něm postavené stejnojmenné distribuci GNU Guix. S init systémem a správcem služeb GNU Shepherd. S experimentální podporou jádra GNU Hurd. Na vývoji se podílelo 744 vývojářů. Přibylo 12 525 nových balíčků. Jejich aktuální počet je 30 011. Aktualizována byla také dokumentace.

    Ladislav Hagara | Komentářů: 4
    včera 15:44 | Zajímavý software

    Na adrese gravit.huan.cz se objevila prezentace minimalistického redakčního systému GravIT. CMS je napsaný ve FastAPI a charakterizuje se především rychlým načítáním a jednoduchým ukládáním obsahu do textových souborů se syntaxí Markdown a YAML místo klasické databáze. GravIT cílí na uživatele, kteří preferují CMS s nízkými nároky, snadným verzováním (např. přes Git) a možností jednoduchého rozšiřování pomocí modulů. Redakční

    … více »
    2012 | Komentářů: 0
    včera 12:55 | Zajímavý software

    Tým Qwen (Alibaba Cloud) uvolnil jako open-source své modely Qwen3‑TTS pro převádění textu na řeč. Sada obsahuje modely VoiceDesign (tvorba hlasu dle popisu), CustomVoice (stylizace) a Base (klonování hlasu). Modely podporují syntézu deseti různých jazyků (čeština a slovenština chybí). Stránka projektu na GitHubu, natrénované modely jsou dostupné na Hugging Face. Distribuováno pod licencí Apache‑2.0.

    NUKE GAZA! 🎆 | Komentářů: 0
    včera 01:11 | Nová verze

    Svobodný citační manažer Zotero (Wikipedie, GitHub) byl vydán v nové major verzi 8. Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    22.1. 16:55 | Nová verze

    Byla vydána verze 1.93.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.

    Ladislav Hagara | Komentářů: 0
    22.1. 14:00 | Komunita

    Svobodný operační systém ReactOS (Wikipedie), jehož cílem je kompletní binární kompatibilita s aplikacemi a ovladači pro Windows, slaví 30. narozeniny.

    Ladislav Hagara | Komentářů: 8
    22.1. 11:00 | IT novinky

    Společnost Raspberry Pi má nově v nabídce flash disky Raspberry Pi Flash Drive: 128 GB za 30 dolarů a 256 GB za 55 dolarů.

    Ladislav Hagara | Komentářů: 2
    22.1. 10:22 | Zajímavý software

    Technologie Skip pro multiplatformní mobilní vývoj, která umožňuje vývojářům vytvářet iOS a Android aplikace z jediné Swift a SwiftUI kódové základny, se s vydáním verze 1.7 stala open source.

    Ladislav Hagara | Komentářů: 6
    Které desktopové prostředí na Linuxu používáte?
     (17%)
     (6%)
     (0%)
     (10%)
     (21%)
     (3%)
     (5%)
     (2%)
     (11%)
     (35%)
    Celkem 584 hlasů
     Komentářů: 17, poslední 22.1. 15:24
    Rozcestník

    Dotaz: Převod naskenovaného PDF na obrázek

    28.12.2005 15:30 Sedeki | skóre: 17 | blog: sedeki
    Převod naskenovaného PDF na obrázek
    Přečteno: 1613×
    Mám velké množství studijních materiálů v PDF, bohužel jsou to hnusné oskenované stránky. Pro čtení na obrazovce to tedy moc není a pro tisk nemůžu použít jednoduše pdftotext. Vytisknout to ale jako 300 stran obrázků je o toner, navíc čitelnost díky flekům je stejně mizerná jako na obrazovce.

    Jednotlivé znaky jsou docela výrazné, takže použít OCR by nebyl problém. Jenomže žádný z mě známých OCR pro Linux PDF nepřečte a stejně tak žádný z programů na čtení PDF nemá hromadný export do PNG nebo obd. v pořádné kvalitě. Pokud třeba v KPDF (navíc ručně) označím část textu a dám ho vyimportovat jako PNG, vyjde, asi kvůli nastavené vysoké kompresi jen barevný flek.

    Jak to provést?
    Mnozí spadnou dolů a jen málokteří spatří znovu slunce.

    Odpovědi

    28.12.2005 16:01 Zdeněk Burda | skóre: 61 | blog: Zdendův blog | Praha
    Rozbalit Rozbalit vše Re: Převod naskenovaného PDF na obrázek
    convert soubor.pdf soubor.png

    convert je součástí balíku ImageMagick
    -- Nezdar není hanbou, hanbou je strach z pokusu.
    28.12.2005 16:57 #Tom
    Rozbalit Rozbalit vše Re: Převod naskenovaného PDF na obrázek
    Mně se osvědčil příkaz pdftoppm z balíku Xpdf. Převádí na obrázky i běžné (vektorové) PDF soubory.
    28.12.2005 18:04 vend | skóre: 19
    Rozbalit Rozbalit vše Re: Převod naskenovaného PDF na obrázek

    Jde to i pomocí GhostScriptu. Pokud zadáš jako -sDEVICE=jpeg
    a -sOUTPUTFILE=obrazek.jpg , tak dostaneš výstup (v souboru obrazek.jpg) jako jpeg.

    Viz: man gs

    28.12.2005 18:44 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: Převod naskenovaného PDF na obrázek
    zaujimala by ma ucinnost konverzie daneho dokumentu ulozeneho do formatu JPG a skonvertovaneho na text pomocou OCR. nie preto ze by som chcel byt neslusny, ale spomenul som si na stare vysokoskolske skripta kopirovane pomocou cyklostylu.
    28.12.2005 18:27 #Tom
    Rozbalit Rozbalit vše Ach jo
    Zase jsem sem jednou poslal ptákoviny. Zatímco Ghostscipt (a ImageMagick, který se obslouží přes něj) i pdftoppm se namáhají s vykreslováním PDF do paměti a následným ukládáním obrázků do souboru - a to trvá celkem dlouho - takové pdfimages (rovněž z Xpdf balíku) uloží pěkně všechny rastrové obrázky z PDF do souborů ve formátu PPM, PBM či JPEG a hlavně rychle. Není třeba se obtěžovat s DPI a podobnými věcmi.
    28.12.2005 21:18 Sedeki | skóre: 17 | blog: sedeki
    Rozbalit Rozbalit vše Re: Převod naskenovaného PDF na obrázek
    Díky, uvedené možnosti fungují dobře. A co se týče úspěšnosti OCR (ocrad) u daných dokumentů je to cca od 80 do 92 procent + ledacos doplní aspell. Na to, jak nekvalitní je předloha (naprosto porušené kompresí + některá menší písmenka jsou snad z 8x5 pixelů) je to docela úspěch a výsledek se dá docela obstojně použít.
    Mnozí spadnou dolů a jen málokteří spatří znovu slunce.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.