我需要一种方法来搜索来自C#的pdf中的短语(多字符串,如“红球”)。
我找到了一种从C#
打开pdf文件并执行搜索的方法。但是,它会单独搜索每个单词而不是短语。有趣的是,如果我打开一个pdf文件并使用高级搜索,它将搜索它作为一个完整的术语而不是两个单独的单词,但它不会从命令行执行相同的操作。
我在网上进行了大量搜索并尝试了我能想到的一切(添加引号,添加\
“,添加单引号,使用+, &, _,
以及其他字词之间)。必须这是一种方法,因为它在pdf中工作,我只需要一种方法从命令行调用它。任何人都可以帮助吗?
这就是我所拥有的。这有效,但它会单独搜索每个单词。所以它找到了"red ball", as well as "red", "ball," "reddening", and "balled"
。我只想找到"red ball"
。
string strParams = " /A \"search=" + "red ball" + "\"" + fileDirectory + strFilePath + "\"";
System.Diagnostics.Process.Start("AcroRd32.exe", strParams);
答案 0 :(得分:0)
答案 1 :(得分:0)
抱歉,您必须对文件进行反编译,提取每个页面内容部分,解压缩并在每个部分内进行快乐搜索。因此,您需要任何PDF库或自己编写。