在Python 3中提取PDF元数据

时间:2015-05-31 21:51:29

标签: python metadata

从PDF文件中获取元数据的最佳模块或简易脚本是什么? 一切似乎都是python 2.7或模块不能工作。 我需要它来运行python 3.4.2。

https://pypi.python.org/pypi/pdfminer/ = Python 2.7

使用PyPDF2:

使用:print(input1.getDocumentInfo()) 我一直在收到错误:

raise utils.PdfReadError("file has not been decrypted")
PyPDF2.utils.PdfReadError: file has not been decrypted


任何提示或帮助?
感谢

1 个答案:

答案 0 :(得分:2)

通过查看错误信息,您正在尝试读取加密的PDF文件。在您提供解密密码之前,您将无法从该文件中获取任何内容。

如果你想要一个{3}的Python 3版本,那么试试pdfminer3k,它声称是一个Python 3端口。