我们使用elasticsearch来索引网络内容。 内容很可能包含指向其他网站的链接。 问题是弹性搜索索引域作为单个词。 在查询google.com时,搜索不会生成包含字符串www.google.com
的文档我希望能够根据域和子域的查询匹配所有文档。
我找到的一个解决方案是将所有网址提取到另一个字段并使用路径层次结构分析器。
但还有其他解决方案并不需要这个吗?我宁愿将www.google.com编入索引为三个不同的单词(使用点作为标记)并在我的查询中使用括号,如下所示:" google.com"