如何在Python中逐行读取PDF文件?

时间:2016-03-30 21:07:18

标签: python python-2.7 pdf

我在python 2.7中逐行阅读PDF文件时遇到问题 我想分别读取每一行并打印出来,这个网站上的解决方案我以前用过但不能正常工作。

我试试这段代码

import PyPDF2
pdfFileObj = open('c:\python\anms.pdf','rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
pdfReader.numPages
pageObj = pdfReader.getPage(0)
pageObj.extractText()

但是这段代码提取PDF中的所有字符串我想要提取所有字符串,但不是一行一行地提取。

导入PyPDF2

pdfFileObj = open(' c:\ python \ anms.pdf',' rb')

pdfReader = PyPDF2.PdfFileReader(pdfFileObj)

pdfReader.numPages

pageObj = pdfReader.getPage(0)

pageObj.extractText()

但是这段代码提取PDF中的所有字符串我想要逐行提取所有字符串。

0 个答案:

没有答案