在python中阅读pdf

时间:2015-08-20 06:46:16

标签: python pdf

我想在python中读取pdf文件。尝试了一些方法 - PdfReader和pdfquery,但没有得到字符串格式的结果。想要获得该pdf文件中的一些内容。有没有办法做到这一点?

2 个答案:

答案 0 :(得分:0)

PDFminer是一个从PDF文档中提取信息的工具。

答案 1 :(得分:-1)

在您的情况下,如果文件是pdf是否重要。如果您只想将文件读取为字符串,只需打开它就像打开普通文件一样。

E.g .-

with open('my_file.pdf') as file:
     content = file.read()