Portál AbcLinuxu, 5. května 2025 15:05
from PyPDF3 import PdfFileReader, PdfFileWriter from PyPDF3.pdf import PageObject ... for i in range(pdf_input.getNumPages()): input_page = pdf_input.getPage(i) output_page = PageObject.createBlankPage(None, input_page.mediaBox.getWidth(), input_page.mediaBox.getHeight()) output_page.mergeTransformedPage(input_page, (1, 0, 0, y_scale, x_offset, y_offset)) output.addPage(output_page) ...
Řešení dotazu:
jak jako neposunou?? :O :O je tam jakoby vidim posunutý v tom přiloženým pdfku :O :O
sem vobarvila tomu tvýmu originálu v libreoffice pozadí noa obrázek výstupu máš v příloze. se to chová jak se jako vod toho čeká si myslim :O ;D
zdrojáček máme snad podobnej
from PyPDF3 import PdfFileReader, PdfFileWriter from PyPDF3.pdf import PageObject pdf_input = PdfFileReader(open("original.pdf","rb")) output = PdfFileWriter() y_scale = 0.5 x_offset = 0 y_offset = 0 for i in range(pdf_input.getNumPages()): input_page = pdf_input.getPage(i) output_page = PageObject.createBlankPage(None, input_page.mediaBox.getWidth(), input_page.mediaBox.getHeight()) output_page.mergeTransformedPage(input_page, (1, 0, 0, y_scale, x_offset, y_offset)) output.addPage(output_page) outputStream = open("output.pdf", "wb") output.write(outputStream)
fakt žejo máš pravdu :O :O :O :O posune se jenom text ale ta klikací věc zustane na místě :O :O
problém asi jako nebude v tý hejbací matici ta je 100% dobře ale asi to bude v tom že ten text 'www.seznam.cz' a samotný mačkátko sou asi reprezentovaný v tom pdf formátu nějak vzlášť a hejbací matice funguje jenom na textík :O :O :/ :/ pdfkům nerozumim ale vypadá to že to tu transformaci samo nepočítá ale že to jenom do výstupu připiše na patřičný místo za řádeček se slovem 'stream' hejbací matici jako další řádeček '1 0 0 1 0 0 cm' podle toho jaký sou do tý hejbací matice strčený parametry. noa je votázka jestli takle ta strčená matice funguje na všecky voběkty v tom pdf nebo jenom na něco :O :O jakože asi jenom na to něco :O :/
pomocí qpdf hele de předělat *.pdf do normálně textovým editorem čitelný podoby a číst si ho noa asi pak zkusit udělat diff a najít v čem se liší originál a zmenčenina ale jestli nato chceš kašlat tak možná rači zkusit najít nějakou jinou knihovnu/nástroj třeba scribus de skriptovat taky v pythonu ale vživotě sem tam nic neskritovala tak nevim :/ :/
expandovanej originál v příloze
nóó tak to mačkátko je v pdfku jakoby reprezentovaný takle
%% Original object ID: 5 0 5 0 obj << /A << /S /URI /Type /Action /URI (https://www.seznam.cz/) >> /Border [ 0 0 0 ] /F 4 /Rect [ 6 542.25 256.5 570 ] /Subtype /Link /Type /Annot >> endobj
a ty hodnoty v /Rect[] sou absolutní souřadnice x y x y dvou rohů toho čtverečku mačkátka a když je v textovým editoru (kwrite) přepišu a uložim tak se to mačkátko v pdfku posune :D nóó takže by to jako asi šlo vobejít převedením do tý expandovaný podoby proparsovat text a na ty dvě souřadnice udělat hejbnutí a zase jako nějak vodexpandovat jestli by byl soubor moc velkej :O ;D
hejbací matici sem zkoušela dát na začátek i jinejch streamů v tom dokumentu nevim teda jestli sem to dělala dobře ale buď se to nijak neprojevilo nóó nebo to dokument/text nějak rozbilo tak nevim :O :O
from PyPDF3 import PdfFileReader, PdfFileWriter from PyPDF3.pdf import PageObject from PyPDF3.generic import RectangleObject, NameObject import decimal pdf_input = PdfFileReader(open("original.pdf","rb")) output = PdfFileWriter() y_scale = decimal.Decimal(0.5) x_offset = 0 y_offset = 0 for i in range(pdf_input.getNumPages()): input_page = pdf_input.getPage(i) output_page = PageObject.createBlankPage(None, input_page.mediaBox.getWidth(), input_page.mediaBox.getHeight()) output_page.mergeTransformedPage(input_page, (1, 0, 0, y_scale, x_offset, y_offset)) annots = output_page["/Annots"] for annot in annots: annot = annot.getObject() rect = RectangleObject(annot['/Rect']) rect_x0 = rect.getUpperLeft_x() rect_y0 = rect.getUpperLeft_y() rect_x1 = rect.getLowerRight_x() rect_y1 = rect.getLowerRight_y() annot.update({ NameObject('/Rect'): RectangleObject([rect_x0, rect_y0 * y_scale, rect_x1, rect_y1 * y_scale]) }) output.addPage(output_page) outputStream = open("output.pdf", "wb") output.write(outputStream)Dík za postrčení.
jo to bude asi vono :D ;D
akorát dyštak jakoby eště přičíst ten offset jestli ho někdo potřebujete ale to už je detail ;D
se vomlouvám sem zapoměla zavřit stream :O :O :O :O
todleto rači přidat jako poslední řádek jinak to muže někdy blbnout :O :O
outputStream.close()
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.