查找PDF中的文本,其中文本始终不相同

时间:2014-05-21 16:48:11

标签: c# pdf itextsharp

我发现这篇文章很有帮助,但我需要稍微扩展它以获得我需要的东西 - Search Particular Word in PDF using Itextsharp

我的PDF中有一些文字是这样的:

Full Name:  Bob Smith

文本“全名”将始终在PDF中,但我不知道“全名”的价值是什么,我需要能够找到它。

有没有办法在PDF中搜索某个文本并获取该字段的值而不是只查找字段名称?我需要能够获得“Bob Smith”或该领域的任何内容。名称“Bob Smith”将在每个PDF上的相同位置,并在“全名”字段后的相同数量的空格处开始,我只是不确定如何捕获“Bob Smith”

1 个答案:

答案 0 :(得分:1)

我正在使用ABCPDf 但逻辑可能是相同的

使用像GETTEXT这样的东西将整个文档放入字符串中           for (int i = 0; i <= doc.PageCount; i++) { doc.PageNumber = i; theDocString += doc.GetText(Page.TextType.Text); }

然后使用Indexof搜索某些字符串         int index = theDocString.IndexOf(str, 0, StringComparison.CurrentCultureIgnoreCase); bool isFound = index != -1;