我有几个pdf,其中散布了一些代码(没有固定位置),如下所示:
oneCode=abcd
twoCode=4566
此外,文本的字体颜色为白色(与PDF的背景颜色相同)。所以它们看不见。
我想编写一个程序来解析使用密钥的pdf(完整单词的第一部分,例如oneCode,twoCode等)并获取相应的值(例如abcd,4566等)。
这些功能是否可用于任何开源pdf解析器,如PDFBox,iText等?
任何人都可以指出一个例子吗?
感谢阅读!
答案 0 :(得分:0)
也许this question会帮助你。
最高版本2.1.7 iText是开源的,可免费用于商业用途。请确保您在2.1.7及更低版本中提供所需的方法。 否则,您可以从source-forge获取最新版本。但请注意,他们的许可证不明确,他们从source-forge中删除了旧版本。