我想在python中读取pdf文件。尝试了一些方法 - PdfReader和pdfquery,但没有得到字符串格式的结果。想要获得该pdf文件中的一些内容。有没有办法做到这一点?
答案 0 :(得分:0)
PDFminer是一个从PDF文档中提取信息的工具。
答案 1 :(得分:-1)
在您的情况下,如果文件是pdf是否重要。如果您只想将文件读取为字符串,只需打开它就像打开普通文件一样。
E.g .-
with open('my_file.pdf') as file:
content = file.read()