solr:如何将字段拆分成重叠的双字短语?

时间:2017-07-21 05:03:48

标签: solr

想法是利用双字短语处理。 例: 有足够的推力,猪飞得很好:

(足够) (足够的推力) (推力猪) (猪飞) (只飞) (就好了)

1 个答案:

答案 0 :(得分:0)

使用ShingleFilter

  

在:"成为,或者是什么?"

     

Tokenizer to Filter:" To"(1)," be"(2),"或"(3)," what&#34 ;(4)

     

Out:" To"(1)," To"(1)," be"(2)," be或&#34 ;(2),"或"(3),"或什么"(3),"什么"(4)

如果您还将outputUnigrams设置为false,则无法获得单个令牌(即Tobe等将被排除在外。

edismax处理程序中还包含参数pf2pf3的内置支持,可以考虑两个或三个标记的带状疱疹进行评分。