如何检测,损坏pdf(使用python)?
我有很多pdf。其中一些pdf已损坏,应删除。我如何检测和删除?
我用过:
from pyPdf import PdfFileReader
try :
mypdf = PdfFileReader(file( 'sample.pdf', 'rb'))
except:
print ' is invalid pdf'
但是如何自动从文件中读取pdf并删除损坏的pdf文件?
答案 0 :(得分:1)
Adobe Reader实际上包含许多自动修复功能,因此它会打开大量损坏的PDF文件。