对于synonymfilterfactory,我使用以下配置:
<filter
class="solr.SynonymFilterFactory"
synonyms="synonyms.txt"
ignoreCase="true"
expand="true"
tokenizer="solr.KeywordTokenizerFactory"
/>
但是当我对内容编制索引时,使用keywordtokenizerfactory
不会对令牌进行标记位置-1-2-3-4-5
术语text-i-am-a-cardiologist-specialist
---------------------心脏
令牌“心脏”被标记为与心脏病专家相同的位置,并创建一个名为“专家”的单独令牌。
在我的synonyms.txt中,我提到过:
心脏病专家,心脏病专家
我不希望同义词“心脏专家”被分成两个令牌(这就是为什么我在同义词配置中提到了keywordtokenizerfactory。有没有办法将多词synoym保存为单个令牌?< / p>