标签: lucene proximity
我有一个简单的Lucene索引扫描文档页面,其中包含一个包含页面文本的字段。
我正在尝试查找姓氏/姓氏组合,因此请运行搜索,例如。 “伊丽莎白怀特”〜3回复命中伊丽莎白和怀特三个单词的地方。
在开始实施我的搜索代码之前,我一直在使用Luke -Lucene Index Toolbox v 0.9.9检查各种搜索
返回的匹配文档列表包含的术语超过3个单词的结果??
这些额外的点击确实得分较低,但我不确定 (a)为什么会发生这种情况或(b)如何确定我应该使用的最低分数。
罗杰