我工作的公司希望自动审核他们发布给客户的PDF文件,除了验证文本的某些部分外,是否有任何好的工具或开源文件可以让您确定客户收到的PDF文件你期望它是什么? 很多PDF都是动态生成的,所以我没有一个明确的基线,只有1对1的文件应该是什么样子。 我正在寻找能够在表单结构而不是文本方面给予安全性的解决方案
答案 0 :(得分:1)
使用iText
(特别是pdf2Data
),您可以从PDF文件中提取所有信息,并将其与给定模板进行匹配。
采用这种方法,您可以轻松验证PDF是否包含您希望其中包含的所有信息。
在此处查看pdf2Data
:
http://pdf2data.online/