我试图弄清楚如何让Lucene做我需要的事情。我们通过立法指导进行搜索,并需要找到搜索短语的结果,例如"立法第9.8.1段和第34段。这应该返回与该字符串匹配的任何内容。 StandardAnalyzer存在问题,因为如果实际文本是“立法”第9.8.1节,它不会返回结果。"或者"立法第9.8.1(a)段和第34段。我正在尝试非常简单的查询,如:
bodyText: "legislation paragraph 9.8.1*"
和
bodyText: "legislation paragraph 9.8.1"
我的问题是:
1)Lucene如何理解如下的查询?
bodyText: "legislation paragraph 9.8*"
明星显然没有被视为通配符。
3)有没有办法实现我想要做的事情?搜索短语的结果集"立法第9段和第34段;必须包含查询"立法第9.8和#34段的所有结果。换句话说,我想实现一个简单的不区分大小写的字符串匹配。
我们构建的Lucene版本是2.9。
感谢您的帮助。