我使用Apache Solr使用DataImportHandler进行索引。 文件结构如下:
id(长),标题(文本),摘要(文本),pubDate(日期)
我将标题和摘要归结为文本搜索。我的问题是我查询时 “title:utility”然后它给出如下结果:
id,title
6,金融交易洞察能源与能源公用事业 2008年12月11,经济衰退时的住宅实用零售策略
16,金融交易见解:能源与发展公用事业 2008年回顾
41,太阳能是实用企业战略的核心我只想搜索“实用程序”,但它也为实用程序提供了结果...... 我也试过标题:“实用程序”和标题:实用程序〜1但它没有用。 我读到了关于'阻止'但我不知道如何使用它... 请帮我.. 感谢..
答案 0 :(得分:3)
这是文本分析中PorterStemFilterFactory的原因。
<filter class="solr.PorterStemFilterFactory"/>
Stemmer会将单词减少为root,因此实用程序也会匹配实用程序。
检查您是否需要Stemmer进行搜索,否则您可以将其从过滤器链中删除 否则,请检查不那么激进的割线机以满足您的需求。