从java中的pdf中读取隐藏的内容

时间:2013-10-17 06:36:11

标签: java itext pdfbox

我有几个pdf,其中散布了一些代码(没有固定位置),如下所示:

oneCode=abcd
twoCode=4566

此外,文本的字体颜色为白色(与PDF的背景颜色相同)。所以它们看不见。

我想编写一个程序来解析使用密钥的pdf(完整单词的第一部分,例如oneCode,twoCode等)并获取相应的值(例如abcd,4566等)。

这些功能是否可用于任何开源pdf解析器,如PDFBox,iText等?

任何人都可以指出一个例子吗?

感谢阅读!

1 个答案:

答案 0 :(得分:0)

也许this question会帮助你。

最高版本2.1.7 iText是开源的,可免费用于商业用途。请确保您在2.1.7及更低版本中提供所需的方法。 否则,您可以从source-forge获取最新版本。但请注意,他们的许可证不明确,他们从source-forge中删除了旧版本。