我使用Lucene.NET来索引一组文档的内容。我的索引包含几个字段,但我主要关注的是查询“内容”字段。我正在尝试找出索引的最佳方法,以及创建查询,以满足要求。
以下是当前的要求:
有些文件很大,所以我想我们不想做Field.Store.Yes,对吧?除非我们必须做我们需要做的事情。
答案 0 :(得分:3)
使用lucene的标准分析仪和queryparser可以很好地处理您列出的要求。确保在IndexWriter和QueryParser中使用相同的分析器。停止言语被消除。标点符号通常被忽略,但规则更多涉及忽略每个标点字符(如果您对细节感兴趣,请参阅UAX #29, section 4)
如果您尝试运行Lucene demo,您应该会发现它的功能正如您在此处指定的那样。
至于存放场地,你说得对,是的。如果需要从索引中检索字段,请存储该字段。您不需要存储的大字段不需要存储。