在pdf命令行中搜索短语

时间:2012-08-30 12:15:24

标签: c# string search pdf command-line

我需要一种方法来搜索来自C#的pdf中的短语(多字符串,如“红球”)。
我找到了一种从C#打开pdf文件并执行搜索的方法。但是,它会单独搜索每个单词而不是短语。有趣的是,如果我打开一个pdf文件并使用高级搜索,它将搜索它作为一个完整的术语而不是两个单独的单词,但它不会从命令行执行相同的操作。

我在网上进行了大量搜索并尝试了我能想到的一切(添加引号,添加\“,添加单引号,使用+, &, _,以及其他字词之间)。必须这是一种方法,因为它在pdf中工作,我只需要一种方法从命令行调用它。任何人都可以帮助吗?

这就是我所拥有的。这有效,但它会单独搜索每个单词。所以它找到了"red ball", as well as "red", "ball," "reddening", and "balled"。我只想找到"red ball"

string strParams = " /A \"search=" + "red ball" + "\"" + fileDirectory + strFilePath + "\"";
System.Diagnostics.Process.Start("AcroRd32.exe", strParams);

2 个答案:

答案 0 :(得分:0)

搜索参数确实仅用于单词列表,无法搜索短语(或超过32个字符):

Adobe Docs

  

您只能搜索单个单词。您无法搜索字符串   的话

您可以尝试替代读者或library

答案 1 :(得分:0)

抱歉,您必须对文件进行反编译,提取每个页面内容部分,解压缩并在每个部分内进行快乐搜索。因此,您需要任何PDF库或自己编写。