从elasticsearch中的索引数据中提取属性

时间:2013-03-14 20:45:21

标签: elasticsearch

我无法理解Elasticsearch中标记器和分析器的可能性。

假设有一组产品的索引数据。每个产品都有一个带有描述文本的字段。在描述中,颜色被命名。

是否可以使用其中一个内置分析器或自定义标记器/分析器来提取颜色信息(例如,基于一组关键字[红色,绿色,蓝色,黄色等])并附加新的颜色信息颜色信息作为产品的单独字段?

使用通用属性(例如颜色,材料等)来增加传入数据是一个很好的功能。

1 个答案:

答案 0 :(得分:0)

您描述的过程更多地与实体识别有关。有不同的库可以提供文本:OpenNLPUIMA等等。

您可能需要查看elasticsearch OpenNLP plugin,它完全符合您的要求:检测实体并将相应的字段添加到传入的文档中。