从PDF文件中获取元数据的最佳模块或简易脚本是什么? 一切似乎都是python 2.7或模块不能工作。 我需要它来运行python 3.4.2。
https://pypi.python.org/pypi/pdfminer/ = Python 2.7
使用PyPDF2:
使用:print(input1.getDocumentInfo())
我一直在收到错误:
raise utils.PdfReadError("file has not been decrypted")
PyPDF2.utils.PdfReadError: file has not been decrypted
任何提示或帮助?
感谢
答案 0 :(得分:2)
通过查看错误信息,您正在尝试读取加密的PDF文件。在您提供解密密码之前,您将无法从该文件中获取任何内容。
如果你想要一个{3}的Python 3版本,那么试试pdfminer3k
,它声称是一个Python 3端口。