在Django应用程序中处理上传的PDF文件有哪些不同的选项?

时间:2009-09-07 17:49:43

标签: python django pdf

我们的Django应用程序需要对上传的PDF文件做一些事情:

  1. 验证该文件是否为PDF且未损坏
  2. 检查文件是否未加密
  3. 计算页数
  4. 我们遇到一个不幸受欢迎的应用程序的问题,即未加密的PDF导出的想法实际上是加密的PDF文件,只是使用空密码。我们一直在使用PyPDF,因为加密是非标准的,因此无法读取这些文件。导出这些文件的应用程序在我们的用户中非常流行,这很痛苦。

    另一个应用程序导出了MIME类型不正确的文件(application/pdf以外的其他文件),所以无论我们最终使用什么都需要能够应对这样的愚蠢窒息点。

    我们可以在任何地方使用积极维护的强大PDF库吗?甚至PDFtk,一对人们推荐的CLI实用程序,最近一次更新于2006年。

    感谢任何帮助。

    更新:为了澄清,它可以是免费的或付费的。建议你认为最好的选择。

1 个答案:

答案 0 :(得分:1)

PDFlib非常好,但要花钱。你没有说它必须是免费的,虽然我暗示某种程度上我假设你想要它! :)