Question

从PDF文件中获取元数据的最佳模块或简易脚本是什么？一切似乎都是python 2.7或模块不能工作。我需要它来运行python 3.4.2。

https://pypi.python.org/pypi/pdfminer/ = Python 2.7

使用PyPDF2：

使用：print(input1.getDocumentInfo()) 我一直在收到错误：

raise utils.PdfReadError("file has not been decrypted")
PyPDF2.utils.PdfReadError: file has not been decrypted

任何提示或帮助？
感谢

Answer 1

通过查看错误信息，您正在尝试读取加密的PDF文件。在您提供解密密码之前，您将无法从该文件中获取任何内容。

如果你想要一个{3}的Python 3版本，那么试试pdfminer3k，它声称是一个Python 3端口。