Portál AbcLinuxu, 25. dubna 2024 01:34


Dotaz: Změna velikosti obsahu PDF (Python)

1.9.2020 15:53 vlanav | skóre: 24 | blog: Dlouhý den
Změna velikosti obsahu PDF (Python)
Přečteno: 591×
Odpovědět | Admin
Přílohy:
Snažím se změnit velikost obsahu stránky v PDF souboru abych mohl něco později přidat na horní okraj. Funguje to vcelku dobře, ale odkazy se neposunou. Jak udělat aby se posunuly i odkazy?
from PyPDF3 import PdfFileReader, PdfFileWriter
from PyPDF3.pdf import PageObject

...

    for i in range(pdf_input.getNumPages()):
        input_page = pdf_input.getPage(i)
        output_page = PageObject.createBlankPage(None,
                      input_page.mediaBox.getWidth(),
                      input_page.mediaBox.getHeight())
        output_page.mergeTransformedPage(input_page, (1, 0, 0, y_scale, x_offset, y_offset))
        output.addPage(output_page)
...


Řešení dotazu:


Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

Gréta avatar 1.9.2020 16:53 Gréta | skóre: 36 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)
Odpovědět | | Sbalit | Link | Blokovat | Admin
Příloha:

jak jako neposunou?? :O :O je tam jakoby vidim posunutý v tom přiloženým pdfku :O :O

sem vobarvila tomu tvýmu originálu v libreoffice pozadí noa obrázek výstupu máš v příloze. se to chová jak se jako vod toho čeká si myslim :O ;D

zdrojáček máme snad podobnej

from PyPDF3 import PdfFileReader, PdfFileWriter
from PyPDF3.pdf import PageObject

pdf_input = PdfFileReader(open("original.pdf","rb"))
output = PdfFileWriter()

y_scale = 0.5
x_offset = 0
y_offset = 0

for i in range(pdf_input.getNumPages()):
    input_page = pdf_input.getPage(i)
    output_page = PageObject.createBlankPage(None,
                                             input_page.mediaBox.getWidth(),
                                             input_page.mediaBox.getHeight())
    output_page.mergeTransformedPage(input_page, (1, 0, 0, y_scale, x_offset, y_offset))
    output.addPage(output_page)

outputStream = open("output.pdf", "wb")
output.write(outputStream)
oslavná píseň na pana soudruha generalisima prezidentčíka Petra Pavla Pávka 🎶🫡🦚🎶
1.9.2020 19:53 vlanav | skóre: 24 | blog: Dlouhý den
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)
Díky Gréto. V original.pdf jde na text kliknout a otevře se odkaz. V resized.pdf je viditelný text posunutý, ale klikatelný odkaz zůstane na původním místě.

Klidně si zkus, jestli máš v tom Tvém novém PDF klikatelný link na stejném místě jako text.
Gréta avatar 2.9.2020 16:20 Gréta | skóre: 36 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)

fakt žejo máš pravdu :O :O :O :O posune se jenom text ale ta klikací věc zustane na místě :O :O

problém asi jako nebude v tý hejbací matici ta je 100% dobře ale asi to bude v tom že ten text 'www.seznam.cz' a samotný mačkátko sou asi reprezentovaný v tom pdf formátu nějak vzlášť a hejbací matice funguje jenom na textík :O :O :/ :/ pdfkům nerozumim ale vypadá to že to tu transformaci samo nepočítá ale že to jenom do výstupu připiše na patřičný místo za řádeček se slovem 'stream' hejbací matici jako další řádeček '1 0 0 1 0 0 cm' podle toho jaký sou do tý hejbací matice strčený parametry. noa je votázka jestli takle ta strčená matice funguje na všecky voběkty v tom pdf nebo jenom na něco :O :O jakože asi jenom na to něco :O :/

pomocí qpdf hele de předělat *.pdf do normálně textovým editorem čitelný podoby a číst si ho noa asi pak zkusit udělat diff a najít v čem se liší originál a zmenčenina ale jestli nato chceš kašlat tak možná rači zkusit najít nějakou jinou knihovnu/nástroj třeba scribus de skriptovat taky v pythonu ale vživotě sem tam nic neskritovala tak nevim :/ :/

Gréta avatar 3.9.2020 15:27 Gréta | skóre: 36 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)
Příloha:

expandovanej originál v příloze

nóó tak to mačkátko je v pdfku jakoby reprezentovaný takle

%% Original object ID: 5 0
5 0 obj
<<
  /A <<
    /S /URI
    /Type /Action
    /URI (https://www.seznam.cz/)
  >>
  /Border [
    0
    0
    0
  ]
  /F 4
  /Rect [
    6
    542.25
    256.5
    570
  ]
  /Subtype /Link
  /Type /Annot
>>
endobj

 

a ty hodnoty v /Rect[] sou absolutní souřadnice x y x y dvou rohů toho čtverečku mačkátka a když je v textovým editoru (kwrite) přepišu a uložim tak se to mačkátko v pdfku posune :D nóó takže by to jako asi šlo vobejít převedením do tý expandovaný podoby proparsovat text a na ty dvě souřadnice udělat hejbnutí a zase jako nějak vodexpandovat jestli by byl soubor moc velkej :O ;D

hejbací matici sem zkoušela dát na začátek i jinejch streamů v tom dokumentu nevim teda jestli sem to dělala dobře ale buď se to nijak neprojevilo nóó nebo to dokument/text nějak rozbilo tak nevim :O :O

3.9.2020 19:34 vlanav | skóre: 24 | blog: Dlouhý den
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)
Díky Gréto, ale v takové žumpě se mi potápět nechce. Ale vyzkoušel jsem PyPDF4 a tam to taky nefunguje. Pak jsem ještě vyzkoušel pdfrw a tam to ten neviditelný link odstraní úplně.

A jinou knihovnu (s podobnou funkcionalitou) jsem zatím nenašel.
Řešení 1× (vlanav (tazatel))
3.9.2020 21:41 kelidas | skóre: 7
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)
Příloha:
Před třemi týdny jsem řešil jak zvětšit pdf, aby odkazy byly na správném místě. Nakonec jsem to vzdal a udělal 2 verze.

Doplněná verze kódu, která řeší problém s pozicí odkazů:
from PyPDF3 import PdfFileReader, PdfFileWriter
from PyPDF3.pdf import PageObject
from PyPDF3.generic import RectangleObject, NameObject
import decimal
 
pdf_input = PdfFileReader(open("original.pdf","rb"))
output = PdfFileWriter()

y_scale = decimal.Decimal(0.5)
x_offset = 0
y_offset = 0
 
for i in range(pdf_input.getNumPages()):
    input_page = pdf_input.getPage(i)
    output_page = PageObject.createBlankPage(None,
                                             input_page.mediaBox.getWidth(),
                                             input_page.mediaBox.getHeight())
    output_page.mergeTransformedPage(input_page, (1, 0, 0, y_scale, x_offset, y_offset))
    annots = output_page["/Annots"]
    
    for annot in annots:
        annot = annot.getObject()
        rect = RectangleObject(annot['/Rect'])
        rect_x0 = rect.getUpperLeft_x()
        rect_y0 = rect.getUpperLeft_y()
        rect_x1 = rect.getLowerRight_x()
        rect_y1 = rect.getLowerRight_y()
        annot.update({
            NameObject('/Rect'): RectangleObject([rect_x0, rect_y0 * y_scale, rect_x1, rect_y1 * y_scale])
        })
    
    output.addPage(output_page)
 
outputStream = open("output.pdf", "wb")
output.write(outputStream)
Dík za postrčení.
Gréta avatar 4.9.2020 13:05 Gréta | skóre: 36 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)

jo to bude asi vono :D ;D

akorát dyštak jakoby eště přičíst ten offset jestli ho někdo potřebujete ale to už je detail ;D

Gréta avatar 5.9.2020 13:23 Gréta | skóre: 36 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)

se vomlouvám sem zapoměla zavřit stream :O :O :O :O

todleto rači přidat jako poslední řádek jinak to muže někdy blbnout :O :O

outputStream.close()

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.