Question

我有几个pdf，其中散布了一些代码（没有固定位置），如下所示：

oneCode=abcd
twoCode=4566

此外，文本的字体颜色为白色（与PDF的背景颜色相同）。所以它们看不见。

我想编写一个程序来解析使用密钥的pdf（完整单词的第一部分，例如oneCode，twoCode等）并获取相应的值（例如abcd，4566等）。

这些功能是否可用于任何开源pdf解析器，如PDFBox，iText等？

任何人都可以指出一个例子吗？

感谢阅读！

Answer 1

也许this question会帮助你。

最高版本2.1.7 iText是开源的，可免费用于商业用途。请确保您在2.1.7及更低版本中提供所需的方法。否则，您可以从source-forge获取最新版本。但请注意，他们的许可证不明确，他们从source-forge中删除了旧版本。