标签: python python-2.7 pdf scrapy pdf-extraction
我想知道如何使用scrapy在pdf文件中抓取数据。我应该使用哪个模块,哪个是最好有效的方法?你能不能给我一些关于这个
谢谢!
答案 0 :(得分:2)
我建议您使用Scrapy获取PDF并使用PyPDF2获取PDF中的内容。
对于一个完整但有点旧的(使用pyPDF)示例,请查看this site。