我发现这篇文章很有帮助,但我需要稍微扩展它以获得我需要的东西 - Search Particular Word in PDF using Itextsharp
我的PDF中有一些文字是这样的:
Full Name: Bob Smith
文本“全名”将始终在PDF中,但我不知道“全名”的价值是什么,我需要能够找到它。
有没有办法在PDF中搜索某个文本并获取该字段的值而不是只查找字段名称?我需要能够获得“Bob Smith”或该领域的任何内容。名称“Bob Smith”将在每个PDF上的相同位置,并在“全名”字段后的相同数量的空格处开始,我只是不确定如何捕获“Bob Smith”
答案 0 :(得分:1)
我正在使用ABCPDf 但逻辑可能是相同的
使用像GETTEXT这样的东西将整个文档放入字符串中
for (int i = 0; i <= doc.PageCount; i++)
{
doc.PageNumber = i;
theDocString += doc.GetText(Page.TextType.Text);
}
然后使用Indexof搜索某些字符串
int index = theDocString.IndexOf(str, 0, StringComparison.CurrentCultureIgnoreCase);
bool isFound = index != -1;