Změna velikosti obsahu PDF (Python) (vyřešeno)

jak jako neposunou?? :O :O je tam jakoby vidim posunutý v tom přiloženým pdfku :O :O

sem vobarvila tomu tvýmu originálu v libreoffice pozadí noa obrázek výstupu máš v příloze. se to chová jak se jako vod toho čeká si myslim :O ;D

zdrojáček máme snad podobnej

from PyPDF3 import PdfFileReader, PdfFileWriter
from PyPDF3.pdf import PageObject

pdf_input = PdfFileReader(open("original.pdf","rb"))
output = PdfFileWriter()

y_scale = 0.5
x_offset = 0
y_offset = 0

for i in range(pdf_input.getNumPages()):
    input_page = pdf_input.getPage(i)
    output_page = PageObject.createBlankPage(None,
                                             input_page.mediaBox.getWidth(),
                                             input_page.mediaBox.getHeight())
    output_page.mergeTransformedPage(input_page, (1, 0, 0, y_scale, x_offset, y_offset))
    output.addPage(output_page)

outputStream = open("output.pdf", "wb")
output.write(outputStream)

tlustej pirát profrcal stamiliony za uplný hovadiny🫃, tlustá pirátka šíří antisemitcký bludy🐖

1.9.2020 19:53 vlanav | skóre: 24 | blog: Dlouhý den
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)

Díky Gréto. V original.pdf jde na text kliknout a otevře se odkaz. V resized.pdf je viditelný text posunutý, ale klikatelný odkaz zůstane na původním místě.

Klidně si zkus, jestli máš v tom Tvém novém PDF klikatelný link na stejném místě jako text.

2.9.2020 16:20 MakeIranBombedAgain❗ | skóre: 42 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)

fakt žejo máš pravdu :O :O :O :O posune se jenom text ale ta klikací věc zustane na místě :O :O

problém asi jako nebude v tý hejbací matici ta je 100% dobře ale asi to bude v tom že ten text 'www.seznam.cz' a samotný mačkátko sou asi reprezentovaný v tom pdf formátu nějak vzlášť a hejbací matice funguje jenom na textík :O :O :/ :/ pdfkům nerozumim ale vypadá to že to tu transformaci samo nepočítá ale že to jenom do výstupu připiše na patřičný místo za řádeček se slovem 'stream' hejbací matici jako další řádeček '1 0 0 1 0 0 cm' podle toho jaký sou do tý hejbací matice strčený parametry. noa je votázka jestli takle ta strčená matice funguje na všecky voběkty v tom pdf nebo jenom na něco :O :O jakože asi jenom na to něco :O :/

pomocí qpdf hele de předělat *.pdf do normálně textovým editorem čitelný podoby a číst si ho noa asi pak zkusit udělat diff a najít v čem se liší originál a zmenčenina ale jestli nato chceš kašlat tak možná rači zkusit najít nějakou jinou knihovnu/nástroj třeba scribus de skriptovat taky v pythonu ale vživotě sem tam nic neskritovala tak nevim :/ :/

tlustej pirát profrcal stamiliony za uplný hovadiny🫃, tlustá pirátka šíří antisemitcký bludy🐖

3.9.2020 15:27 MakeIranBombedAgain❗ | skóre: 42 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)

Příloha:

origExpanded.pdf (14483 bytů)

expandovanej originál v příloze

nóó tak to mačkátko je v pdfku jakoby reprezentovaný takle

%% Original object ID: 5 0
5 0 obj
<<
  /A <<
    /S /URI
    /Type /Action
    /URI (https://www.seznam.cz/)
  >>
  /Border [
    0
    0
    0
  ]
  /F 4
  /Rect [
    6
    542.25
    256.5
    570
  ]
  /Subtype /Link
  /Type /Annot
>>
endobj

a ty hodnoty v /Rect[] sou absolutní souřadnice x y x y dvou rohů toho čtverečku mačkátka a když je v textovým editoru (kwrite) přepišu a uložim tak se to mačkátko v pdfku posune :D nóó takže by to jako asi šlo vobejít převedením do tý expandovaný podoby proparsovat text a na ty dvě souřadnice udělat hejbnutí a zase jako nějak vodexpandovat jestli by byl soubor moc velkej :O ;D

hejbací matici sem zkoušela dát na začátek i jinejch streamů v tom dokumentu nevim teda jestli sem to dělala dobře ale buď se to nijak neprojevilo nóó nebo to dokument/text nějak rozbilo tak nevim :O :O

tlustej pirát profrcal stamiliony za uplný hovadiny🫃, tlustá pirátka šíří antisemitcký bludy🐖

3.9.2020 19:34 vlanav | skóre: 24 | blog: Dlouhý den
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)

Díky Gréto, ale v takové žumpě se mi potápět nechce. Ale vyzkoušel jsem PyPDF4 a tam to taky nefunguje. Pak jsem ještě vyzkoušel pdfrw a tam to ten neviditelný link odstraní úplně.

A jinou knihovnu (s podobnou funkcionalitou) jsem zatím nenašel.

Řešení 1× (vlanav (tazatel))

3.9.2020 21:41 kelidas | skóre: 7
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)

Příloha:

output.pdf (9734 bytů)

Před třemi týdny jsem řešil jak zvětšit pdf, aby odkazy byly na správném místě. Nakonec jsem to vzdal a udělal 2 verze.

Doplněná verze kódu, která řeší problém s pozicí odkazů:

from PyPDF3 import PdfFileReader, PdfFileWriter
from PyPDF3.pdf import PageObject
from PyPDF3.generic import RectangleObject, NameObject
import decimal
 
pdf_input = PdfFileReader(open("original.pdf","rb"))
output = PdfFileWriter()

y_scale = decimal.Decimal(0.5)
x_offset = 0
y_offset = 0
 
for i in range(pdf_input.getNumPages()):
    input_page = pdf_input.getPage(i)
    output_page = PageObject.createBlankPage(None,
                                             input_page.mediaBox.getWidth(),
                                             input_page.mediaBox.getHeight())
    output_page.mergeTransformedPage(input_page, (1, 0, 0, y_scale, x_offset, y_offset))
    annots = output_page["/Annots"]
    
    for annot in annots:
        annot = annot.getObject()
        rect = RectangleObject(annot['/Rect'])
        rect_x0 = rect.getUpperLeft_x()
        rect_y0 = rect.getUpperLeft_y()
        rect_x1 = rect.getLowerRight_x()
        rect_y1 = rect.getLowerRight_y()
        annot.update({
            NameObject('/Rect'): RectangleObject([rect_x0, rect_y0 * y_scale, rect_x1, rect_y1 * y_scale])
        })
    
    output.addPage(output_page)
 
outputStream = open("output.pdf", "wb")
output.write(outputStream)

Dík za postrčení.

4.9.2020 13:05 MakeIranBombedAgain❗ | skóre: 42 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)

jo to bude asi vono :D ;D

akorát dyštak jakoby eště přičíst ten offset jestli ho někdo potřebujete ale to už je detail ;D

tlustej pirát profrcal stamiliony za uplný hovadiny🫃, tlustá pirátka šíří antisemitcký bludy🐖

5.9.2020 13:23 MakeIranBombedAgain❗ | skóre: 42 | blog: Grétin blogísek | 🇮🇱==❤️ , 🇵🇸==💩 , 🇪🇺==☭
Rozbalit Rozbalit vše Re: Změna velikosti obsahu PDF (Python)

se vomlouvám sem zapoměla zavřit stream :O :O :O :O

todleto rači přidat jako poslední řádek jinak to muže někdy blbnout :O :O

outputStream.close()

tlustej pirát profrcal stamiliony za uplný hovadiny🫃, tlustá pirátka šíří antisemitcký bludy🐖

Dotaz: Změna velikosti obsahu PDF (Python)

Odpovědi