Scrapy在pdf文件中抓取数据

时间:2015-07-08 09:10:18

标签: python python-2.7 pdf scrapy pdf-extraction

我想知道如何使用scrapy在pdf文件中抓取数据。我应该使用哪个模块,哪个是最好有效的方法?你能不能给我一些关于这个

的示例教程

谢谢!

1 个答案:

答案 0 :(得分:2)

我建议您使用Scrapy获取PDF并使用PyPDF2获取PDF中的内容。

对于一个完整但有点旧的(使用pyPDF)示例,请查看this site