Portál AbcLinuxu, 11. května 2025 21:25

Dotaz: gs - změněné znaky po spojení pdf souborů

19.12.2015 13:11 tonda | skóre: 8
gs - změněné znaky po spojení pdf souborů
Přečteno: 1115×
Odpovědět | Admin
Ahoj

Spojil jsem dva pdf soubory do jednoho pomocí příkazu:
gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=novy_pdf.pdf PL_O_01.pdf PL_O_02.pdf
Po tomto kroku je některý text při vyhledávání (ctrl F) nenalezen. Já text vidím správně napsaný, ale systém nevidí ř, ů, místo 8 je ř a jiné. Takže když zadám vyhledat „veřejným“ sytém slovo nevidí a nenajde. Když zadám vyhledat „ve ejným“ tak to najde. Ukázka zkopírovaného text (v pdf jsou vidět správně všechny znaky):
osobní p epravy, p ístup k ve ejným datovým zdroj m prost ednictvím aplikací MTů nebo internetového prohlížeče a p ístup ke služebním dokument m uloženým v Mtů.
Poradí někdo kde dělám chybu, a jak na to, aby se mi po spojení více pdf nerozhodily znaky. Díky Tonda
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

19.12.2015 15:48 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: gs - změněné znaky po spojení pdf souborů
Odpovědět | | Sbalit | Link | Blokovat | Admin
Můj odhad je, že dva dokumenty byly vytvořeny na dvou různých systémech a používají odlišné kódování. A gs to nespojil. vzhledem k tomu že gs chápu jako primárně rastrovací soft, a nevím jak dobrý je v manipulaci s pdf, doporučuji zkusit balík pdftk.
19.12.2015 20:44 tonda | skóre: 8
Rozbalit Rozbalit vše Re: gs - změněné znaky po spojení pdf souborů
Děkuji za odpověď na můj dotaz.
Můj odhad je, že dva dokumenty byly vytvořeny na dvou různých systémech a používají odlišné kódování.
Oba soubory byly vytvořeny "Microsoft® Word 2010", každý má jiného autora. Kódování nevím jak zjistit.

Co se týče pdftk. V Manjaru (Arch) linux, byl dost dlouho bug a nebyl jsem schopen pdftk nainstalovat. Dnes jsem opět zkusil nainstalovat pdftk a bez úspěchu. Problém viz komentáře: https://aur.archlinux.org/packages/pdftk/?comments=all

Proto jako alternativu používám příkaz gs.
20.12.2015 00:00 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: gs - změněné znaky po spojení pdf souborů
No myslím si, že jen si potřebujete ujasnit jak se staví balík v Archu, když to není jednoduše na klikání nebo jeden příkaz. Když se člověk podívá do zdrojáků pdftk, tak ke postavení potřebuje programy gcjh a gjar (nebo fastjar což tuším je něco z vývojových prostředí pro javu. část vimdiff Makefile.Debian Makefile.Suse
TOOLPATH=                                                     |  TOOLPATH=                                                     
  export VERSUFF=-4.6                                           |  export VERSUFF=-4.3                                           
  export CPP= $(TOOLPATH)cpp$(VERSUFF)                          |  --------------------------------------------------------------
  export CXX= $(TOOLPATH)g++$(VERSUFF)                          |  export CXX= $(TOOLPATH)g++$(VERSUFF)                          
  export GCJ= $(TOOLPATH)gcj$(VERSUFF)                          |  export GCJ= $(TOOLPATH)gcj$(VERSUFF)                          
  export GCJH= $(TOOLPATH)gcjh$(VERSUFF)                        |  export GCJH= $(TOOLPATH)gcjh$(VERSUFF)                        
  export GJAR= $(TOOLPATH)gjar$(VERSUFF)                        |  export GJAR= $(TOOLPATH)fastjar                               
  export LIBGCJ= /usr/share/java/libgcj$(VERSUFF).jar           |  export LIBGCJ= /usr/share/java/libgcj$(VERSUFF).jar           
  export AR= ar                                                 |  export AR= ar                                                 
  export RM= rm                                                 |  export RM= rm                                                 
  export ARFLAGS= rs                                            |  export ARFLAGS= rs                                            
  export RMFLAGS= -vf  
Mám binární distro, tak to nepotřebuji ale je potřeba ty programy doinstalovat jinak se zkompilovat nedá. (a opravit verzi libgcj)
3.1.2016 18:00 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: gs - změněné znaky po spojení pdf souborů
Odpovědět | | Sbalit | Link | Blokovat | Admin

Mám pocit, že ghostscript je více o PostScriptu, který textovou vrstvu nemá, takže bych se vůbec nedivil, že se při převodu něco pokazí.

Na spojování PDF bych doporučil pdfunite z poppleru. Na složitější úpravy pak již zmíněný pdftk.

Ještě by se to dalo udělat pdftexem. Ale to je takové neohrabané.

4.1.2016 10:10 tonda | skóre: 8
Rozbalit Rozbalit vše Re: gs - změněné znaky po spojení pdf souborů
Děkuji za tip. Pdfunite časem jistě vyzkouším.

Instalaci pdftk v Manjaru jsem vzal, a jelikož nechci znova vše přeinstalovávat kvůli jednomu programu, prozatím jsem to vyřešil instalací pdftk ve virtualboxu.

Po použití pdftk se již zmíněné chyby nevyskytují.

Ještě jednou všem děkuji za pomoc.

Tonda

8.1.2016 09:46 ard
Rozbalit Rozbalit vše Re: gs - změněné znaky po spojení pdf souborů
Odpovědět | | Sbalit | Link | Blokovat | Admin
Skuste spojit 2 pdf dokumenty pomocou pdftk:

https://www.pdflabs.com/docs/pdftk-cli-examples/

Join in1.pdf and in2.pdf into a new PDF, out1.pdf

pdftk in1.pdf in2.pdf cat output out1.pdf

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.