我刚刚从我们的产品数据库索引了一堆文本数据。我的目标是评估Apache Solr的生产用途。
这是一个文档示例:
{
"shape":"Geometric",
"color":"MATTE BLACK",
"gender":"unisex",
"model":"CLUBMASTER RX 5154",
"sales":10,
"lens":"rugged",
"material":"plastic",
"brand":"Ray-Ban"
}
我们的搜索应用中最重要的是模糊匹配,因为不准确的搜索字词非常频繁。
所以,我对Solr发现的结果有点失望。
例如:
clubmaster -> many results
club master -> no results
为什么?!
ray ban -> many results
rayban -> no results
在我任期之后,我也尝试过~1甚至~2,没有运气!
所有字段都已编入索引'* _txt_en'预定义字段。