使用python将大型PDF文件拆分为单个PDF

时间:2019-04-12 08:54:39

标签: python pdf pypdf2

我正尝试将每页大的PDF文件从5000页拆分为6000页。PDF文件有7000页的文本和图像,大小为250MB。我编写的python代码适用于较小的PDF文件。

我收到以下错误: 第一个错误是RecursionError: maximum recursion depth exceeded

设置sys.setrecursionlimit(9999)后,出现以下错误Process finished with exit code -1073741571 (0xC00000FD)。 PDF文件已写入我的输出文件夹,但已损坏,大小为0kb。增加递归限制也无济于事。

我该怎么办?压缩PDF文件然后拆分?

这是我的代码:

pdf_file = open(path,'rb')
    pdf_reader = PdfFileReader(pdf_file)
    pageNumbers = pdf_reader.getNumPages()

    output = PdfFileWriter()

    #this is just to test if it works for 1 page
    output.addPage(pdf_reader.getPage(5854))

    with open("output_path" + "document-output.pdf", "wb") as f:
        output.write(f)

1 个答案:

答案 0 :(得分:0)

分享对我有用的东西。我已使用软件包wand来拆分此7000页的PDF文件。 wand package

from wand.image import Image
# Converting #page into JPG
with Image(filename="C:/Users/Name/Documents/PDFfile.pdf[5950]", resolution= 300) as img:
     img.save(filename="C:/Users/Name/Documents/temp1.jpg")