我想刮掉这篇论文(http://www.foundalis.com/res/Foundalis_dissertation.pdf),以获取邦加问题的所有图像以及附录A中列出的解决方案文本供个人使用。这是Bonagrd问题及其解决方案列出的唯一地方。有没有办法像刮网一样刮取PDF?我不确定该怎么做。
答案 0 :(得分:0)
是的,但是大多数PDF软件会将其称为“摘录”。也许这阻碍了您最初的搜索工作。
我不确定您是打算编写代码来执行此操作还是想要一揽子解决方案。但是我公司为Image Extraction和Text Extraction提供了示例代码,可能有帮助。