准备用于Lucene索引的doc和docx文件

时间:2013-02-13 17:01:48

标签: c# .net lucene

我想询问是否有一种快速的方法可以将文档内容放入单个文档字段中。我见过的所有例子都有相对较短的字符串。我无法将整个期刊文章保存到字符串中,并且有一个快速的方法告诉lucene索引文件中的所有单词?我在这个应用程序中使用Lucene.net 3.03。

2 个答案:

答案 0 :(得分:0)

没有一种简单的方法可以传递文件,你必须提供整个内容到lucene来为搜索做索引。 Here是Q / A关于索引PDF的答案,但是对于每种类型的文档都是相同的,只需打开它并索引到lucene。

答案 1 :(得分:0)

您只需将System.IO.TextReader传递给Field即可。如果文件是纯文本或类似文件,您应该只能在其上打开Reader,并将其直接传递到字段中,如:

System.IO.TextReader reader = new StreamReader("path/to/my/file.txt");
Field field = new Field("fieldName", reader);
document.add(field);