Portál AbcLinuxu, 30. dubna 2025 18:20
Při zadání podobného dotazu jako je titulek do Google vám vypadne velké množství odkazů na různé programy tuto akci umožnující (prý i se 100% kvalitou !) ale z linuxových se objeví pouze pdf2ps
, pdftotext
a ps2ascii
, případně jejich různé kombinace.
Tak tedy k tomu, proč jsem tento zápisek stvořil. Včera pozdě večer mi přišel do schránky mail s názvem "Happy 2005 from Novell Customer Communities: Linux Quick Reference Guide", od kterého jsem čekal odkaz na objedávací formulář nějaké pěkné bichle. Nebylo tomu ovšem tak a vevnitř na mně vykoukl odkaz na takové reklamní PDF se základními příkazy do Linuxu, které se ovšem (zvláště začínajícím uživatelům) mohou hodit.
Byl tu ovšem problém právě v té reklamnosti - polovinu stránky A4 tvoří, jak můžete vidět na obrázku, příkazy a druhou polovinu zelená plocha, což se cartridgi v mé tiskárně náramně zamlouvá... To abych si po vytištění třináctistránkové příručky šel koupit novou.
Tak jsem začal hledat řešení pro konverzi do textového souboru, které se po vyzkoušení pdftotext
objevilo v podobě programu pdf2ps
. Pdftotext
mi při pokusu o konverzi prostě nahlásil, že dokument je chráněný a nejde z něj text vykopírovat. S tím jsem se ale nehodlal smířit už proto, že když ten text vidím, tak přece musí v tom PDF někde být...
Podle manuálové stránky je použití ps2ascii
jednoduché:
POUŽITÍ ps2ascii [ vstup.ps [ výstup.txt ] ] ps2ascii vstup.pdf [ výstup.txt ]
Zájemci si mohou stáhnout zmíněné PDF nebo jeho textovou variantu.
Tiskni
Sdílej:
[tomas@tomas otazky ke zkousce]$ pdfinfo otazky-vypracovane.pdf
Title: Microsoft Word - otázky.doc
Author: ...
Creator: ADOBEPS4.DRV Version 4.50
Producer: Acrobat Distiller 5.0.5 (Windows)
CreationDate: Sun Jan 2 11:13:48 2005
ModDate: Sun Jan 2 11:13:48 2005
Tagged: no
Pages: 30
Encrypted: no
Page size: 595 x 842 pts (A4)
File size: 1217313 bytes
Optimized: yes
PDF version: 1.3
pdf2ps
a teprve potéps2ascii
tedy pro tento případ:pdf2ps otazky-vypracovane.pdf [ otazky.ps ]
ps2ascii otazky.ps [ otazky.txt ]
pdftotextktery je soucasti xpdf. Umi i diakritiku. Nefunguje 100%, ale nic lepsiho zdarma pro linux asi neexistuje.
Protože na ŽIVĚ cenzor tento můj dobrý odkaz dnes 15.4.2012 nepříčetně maže (vím není zde normálně místo pro MS-produkty, ale zkuste ve Wine)
Wondershare PDF Editor dočasně BETA free - a mě funguje - stahujte:
první odkaz
pdf-editor druhý odkazpro všechny, kdo jsem přijdou a hledají jak převést pdf do wordu - tedy textu
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.