如何使用ITextSharp验证pdf是否基于文本?

时间:2011-06-11 17:56:26

标签: c# pdf itextsharp itext

我需要验证pdf报告是基于文本的(而不是基于位图;但它可能包含一些图像)。我不需要提取文本,只是为了验证它是基于文本的。

有没有办法如何使用ITextSharp库执行此类验证?

提前致谢,

的Stefan

1 个答案:

答案 0 :(得分:1)

您可以轻松地查找文本绘图命令。您最不重要的工作就是尝试提取文本并查看是否有任何内容。理想情况下,您应该知道它应包含的一些文本并进行搜索。对于这种测试,单个句子或短语就足够了。

使用iText进行文本提取这些日子非常简单。很多例子都围绕SO和网络浮动。