检测并删除损坏的PDF

时间:2013-06-12 09:50:54

标签: pdf corrupt

如何检测,损坏pdf(使用python)?

我有很多pdf。其中一些pdf已损坏,应删除。我如何检测和删除?

我用过:

 from pyPdf import PdfFileReader

try :
     mypdf = PdfFileReader(file( 'sample.pdf', 'rb'))
except:
     print ' is invalid pdf'

但是如何自动从文件中读取pdf并删除损坏的pdf文件?

1 个答案:

答案 0 :(得分:1)

Adob​​e Reader实际上包含许多自动修复功能,因此它会打开大量损坏的PDF文件。