Portál AbcLinuxu, 26. dubna 2024 21:23


Dotaz: Problém z exportem textu z pdf do jpg pomocí pdfimages

25.5.2015 13:34 Brumla01 | skóre: 8
Problém z exportem textu z pdf do jpg pomocí pdfimages
Přečteno: 184×
Odpovědět | Admin

Zdravím

Mám nějaké komiksy v pdfkách rád bych je překonvertoval do jpegů.

Použil jsem na to pdfimages -j komiks.pdf komiks_v_jpegu/.

Dělá mi to však to, že i když to obrázky vyexportuje, tak mi jaksi zmizí text z bublin. Což zážitku ze čtení trochu ubírá :-).

Zkoušel jsem i gscan2pdf, ale dělá mi to to samé

Řešil jste to někdy někdo a vyřešil?

Předem děkuji za odpovědi.

Řešení dotazu:


Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

Řešení 1× (Brumla01 (tazatel))
25.5.2015 14:09 TTTTTTTT
Rozbalit Rozbalit vše Re: Problém z exportem textu z pdf do jpg pomocí pdfimages
Odpovědět | | Sbalit | Link | Blokovat | Admin
pdfimages zřejmě vytáhne z PDF jpegy, které jsou v něm uložené. To je něco jiného než konverze pdf do jpg. Na tu používám `pdftocairo` nebo `convert`, s prvním uvedeným se mi podařilo dosáhnout znatelně lepší kvality.
Řešení 1× (Brumla01 (tazatel))
25.5.2015 14:30 #Tom
Rozbalit Rozbalit vše Re: Problém z exportem textu z pdf do jpg pomocí pdfimages
Odpovědět | | Sbalit | Link | Blokovat | Admin
Celé PDF do obrázků lze převést i pomocí pdftoppm, kter se ovládá stejně jako pdfimages, jen neukládá jednotlivé obrázky, ale vykresluje celé strany v zadaném rozlišení:
pdftoppm -r $DPI -f $PRVNI_STRANA -l $POSLEDNI_STRANA dokument.pdf nazev_ulozenych_obrazku
Jinou možností je použít Ghostscript:
gs -sDEVICE=png16m -sOutputFile=vystup-%03d.png -r$DPI -dBATCH -dNOPAUSE -dTextAlphaBits=4 -dGraphicsAlphaBits=4 vstup.pdf
První parametr udává výstupní formát (Zde PNG s 24bitovou hloubkou (asi 16 milionů barev, odtud 16m), druhé udává název výstupního souboru (%03d označuje číslo strany na tři platná místa doplněné nulami zleva), následuje rozlišení, dávkový režim (po provedení se ukončí), režim bez zastavení (jinak by chtěl stisknout Enter po každé straně), a následující dva příkazy zajišťují vyhlazování po řadě textu a čarové grafiky).

Samozřejmě lze použít ImageMagick (convert) nebo něco jiného, ale mnoho jiných programů vnitřně používá tyto dva, případně též knihovnu Cairo.
25.5.2015 15:14 Brumla01 | skóre: 8
Rozbalit Rozbalit vše Re: Problém z exportem textu z pdf do jpg pomocí pdfimages
Odpovědět | | Sbalit | Link | Blokovat | Admin
Děkuji pánové jest to vyřešeno. Díky!

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.