搜索许多word文档文件中的指定单词

时间:2013-02-04 14:14:51

标签: c# full-text-search search-engine

我有很多单词和excel文件,我想在这些文件的内容中搜索指定单词(用户将其作为参数提供给我的应用程序)。那怎么办呢?我想用C#做这项工作,我可以吗?

我的文件内容采用波斯语。

实际上我想用这些文件创建一个搜索引擎。

感谢。

1 个答案:

答案 0 :(得分:2)

查看Lucene引擎或实现yourslef Inveted Index

来自lucene in 5 min的示例(仅更改为'PersianAnalyzer')

StandardAnalyzer analyzer = new PersianAnalyzer(Version.LUCENE_40);
Directory index = new RAMDirectory();

IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_40, analyzer);

IndexWriter w = new IndexWriter(index, config);
addDoc(w, "Lucene in Action", "193398817");
addDoc(w, "Lucene for Dummies", "55320055Z");
addDoc(w, "Managing Gigabytes", "55063554A");
addDoc(w, "The Art of Computer Science", "9900333X");
w.close()