我有大量具有以下(相关)架构的文档:
{
...
"Description": "word1 word2 ... wordN",
...
}
我想使用Elasticsearch以某种方式从我Description
中提取所有文档中最重复的单词(或短语)。类似的东西:
我想这应该用term vector完成。
现在,我想维护'类别'的树结构,如索引,如:
我想将检测到的术语分配给类别树中的叶子。 e.g。
该作业将是一本手册' (有意识的)从我这边开始操作,但我需要ES至少提供它检测到的常用短语/单词。
然后,当我搜索我的文档时,我希望Elasticsearch以某种方式将文档与我的树结构中的叶子(作为属性)相关联。
e.g:
{
...
"Description": "word4 word5 word6",
"Category": "Category 2.1" <-- by elasticsearch, based on 'word4 word5' in the Description
...
}
我想要使用所有这些,所以我可以通过&#39;类别&#39;在Kibana中可视化我的文档。
我是ES和Kibana的新手,我一般会怎么做?