使用Python从pdf抓取特定文本

时间:2019-07-23 13:40:31

标签: python python-3.7 pdf-scraping

我知道使用.txt文件和.html文件相对容易;但还没有真正找到有关如何通过PDF文档中的位置找到 如何查找和抓取特定文本 的任何真实信息。

我的PDF是字母格式的,其中有一个标题行,价值约5行。在此之下,我需要捕获的内容是左对齐的,就像6一样。(即下图)

PersonsFirstName LastName # want to grab this from pdf, store in variable
513 StreetName St. # then want to grab this from pdf, address, store in variable
Harrisonburg, PA 22801-1860 

是否可以将我的PDF转换为.txt或.html文件?

0 个答案:

没有答案