我使用PyPDF2来获取pdf文件页面的尺寸,但是对于某些pdf返回负数。为什么? 这是example,从第二页开始,实际高度为负。
from PyPDF2 import PdfFileReader
input_file = PdfFileReader(open('file.pdf', "rb"))
for i in range(input_file.getNumPages()):
page = input_file.getPage(i)
real_width, real_height = page.mediaBox.getWidth(),
page.mediaBox.getHeight()
print(real_width, real_height)
在某些情况下,实际身高为负数,怎么会发生?
答案 0 :(得分:1)
因为那是文件中元数据中页面的高度
MediaBox [0 0 792 -612]
您必须询问谁生成了文件,他们是如何进行管理的!您可能只需将其反转即可。