我无法理解Elasticsearch中标记器和分析器的可能性。
假设有一组产品的索引数据。每个产品都有一个带有描述文本的字段。在描述中,颜色被命名。
是否可以使用其中一个内置分析器或自定义标记器/分析器来提取颜色信息(例如,基于一组关键字[红色,绿色,蓝色,黄色等])并附加新的颜色信息颜色信息作为产品的单独字段?
使用通用属性(例如颜色,材料等)来增加传入数据是一个很好的功能。
答案 0 :(得分:0)
您描述的过程更多地与实体识别有关。有不同的库可以提供文本:OpenNLP,UIMA等等。
您可能需要查看elasticsearch OpenNLP plugin,它完全符合您的要求:检测实体并将相应的字段添加到传入的文档中。