PyPDF2返回负尺寸

时间:2019-01-15 14:19:35

标签: python pdf pypdf2

我使用PyPDF2来获取pdf文件页面的尺寸,但是对于某些pdf返回负数。为什么? 这是example,从第二页开始,实际高度为负。

from PyPDF2 import PdfFileReader

input_file = PdfFileReader(open('file.pdf', "rb"))
for i in range(input_file.getNumPages()):
    page = input_file.getPage(i)
    real_width, real_height = page.mediaBox.getWidth(), 
page.mediaBox.getHeight()
    print(real_width, real_height)

在某些情况下,实际身高为负数,怎么会发生?

1 个答案:

答案 0 :(得分:1)

因为那是文件中元数据中页面的高度

MediaBox [0 0 792 -612]

您必须询问谁生成了文件,他们是如何进行管理的!您可能只需将其反转即可。