标签: c# pdf itextsharp itext
我需要验证pdf报告是基于文本的(而不是基于位图;但它可能包含一些图像)。我不需要提取文本,只是为了验证它是基于文本的。
有没有办法如何使用ITextSharp库执行此类验证?
提前致谢,
的Stefan
答案 0 :(得分:1)
您可以轻松地查找文本绘图命令。您最不重要的工作就是尝试提取文本并查看是否有任何内容。理想情况下,您应该知道它应包含的一些文本并进行搜索。对于这种测试,单个句子或短语就足够了。
使用iText进行文本提取这些日子非常简单。很多例子都围绕SO和网络浮动。