我非常喜欢编程,我有一些fortran的经验(来自物理背景)我想编写一个代码来从PDF文件中提取特定信息。任何人都可以指导我如何开始?当然,我可以使用大量的在线应用程序,但我喜欢自己编写代码。 任何建议将不胜感激! 提前谢谢。
答案 0 :(得分:0)
PDF不保存表格格式,它只保留文本的原始位置。但是,https://scraperwiki.com/之前曾帮助过我。他们还有一个部分,您可以编写自己的代码,但我还没有使用它,但它可能是一个很好的起点。
我也发现了这个website,看起来它解释了你想要的东西(它使用了scraperwiki)。