我想在文档中搜索带有空格且没有诸如"base ball"
,"baseball"
这样的空格的产品
如果有人搜索“棒球”,则结果应获取“棒球”和“棒球”的记录
我无法做到这一点,我也不想为此使用“同义词”。
我使用过滤器类"WordDelimiterFilterFactory"
来获得结果,我在同义词文件中使用了诸如sunglass的太阳镜,keychain的钥匙串之类的关键字。
但是会有更多这样的单词,因此即使拆分后也很难找到含义相同的单词。
所以我正在寻找无需使用同义词即可获得所需结果的解决方案
我尝试通过设置catenateWords='1'
来获得该结果,但它也与结果不匹配。
答案 0 :(得分:0)
不添加同义词就不可能做到这一点。您应该将棒球添加为棒球的同义词。
WordDelimiterFilterFactory
被描述。
即使您使用WordDelimiterGraphFilterFactory
也不可能。
generateWordParts
:它像BaseBall一样在驼峰式的情况下散布单词……但对您而言并非如此。
catenateWords
:由于您的单词没有任何特殊的字符或连字符分隔,所以在您的情况下也无法使用。例如wi-fi将获得wifi。
因此,您的数据都应具有要索引的单独单词。这意味着如果您不想使用同义词,则必须按棒球和棒球进行索引,然后只有您才能对这些单词进行搜索。