我正尝试将每页大的PDF文件从5000页拆分为6000页。PDF文件有7000页的文本和图像,大小为250MB。我编写的python代码适用于较小的PDF文件。
我收到以下错误:
第一个错误是RecursionError: maximum recursion depth exceeded
。
设置sys.setrecursionlimit(9999)
后,出现以下错误Process finished with exit code -1073741571 (0xC00000FD)
。 PDF文件已写入我的输出文件夹,但已损坏,大小为0kb。增加递归限制也无济于事。
我该怎么办?压缩PDF文件然后拆分?
这是我的代码:
pdf_file = open(path,'rb')
pdf_reader = PdfFileReader(pdf_file)
pageNumbers = pdf_reader.getNumPages()
output = PdfFileWriter()
#this is just to test if it works for 1 page
output.addPage(pdf_reader.getPage(5854))
with open("output_path" + "document-output.pdf", "wb") as f:
output.write(f)
答案 0 :(得分:0)
分享对我有用的东西。我已使用软件包wand
来拆分此7000页的PDF文件。 wand package
from wand.image import Image
# Converting #page into JPG
with Image(filename="C:/Users/Name/Documents/PDFfile.pdf[5950]", resolution= 300) as img:
img.save(filename="C:/Users/Name/Documents/temp1.jpg")