如何抓取图像和文本的PDF?

时间:2018-08-09 17:29:02

标签: pdf

我想刮掉这篇论文(http://www.foundalis.com/res/Foundalis_dissertation.pdf),以获取邦加问题的所有图像以及附录A中列出的解决方案文本供个人使用。这是Bonagrd问题及其解决方案列出的唯一地方。有没有办法像刮网一样刮取PDF?我不确定该怎么做。

1 个答案:

答案 0 :(得分:0)

是的,但是大多数PDF软件会将其称为“摘录”。也许这阻碍了您最初的搜索工作。

我不确定您是打算编写代码来执行此操作还是想要一揽子解决方案。但是我公司为Image ExtractionText Extraction提供了示例代码,可能有帮助。