使用elasticsearch检测术语,因此我可以将这些术语分配到类别,并按类别可视化文档

时间:2017-10-23 14:17:41

标签: elasticsearch kibana

我有大量具有以下(相关)架构的文档:

{
  ...
  "Description": "word1 word2 ... wordN",
  ...
}

我想使用Elasticsearch以某种方式从我Description中提取所有文档中最重复的单词(或短语)。类似的东西:

  • word1:12
  • word2:9
  • word4 word5:5< - 注意这是一个完整的短语
  • word4:3
  • ...

我想这应该用term vector完成。

现在,我想维护'类别'的树结构,如索引,如:

    • 孩子1
      • 儿童1.1
    • 孩子2
      • Child 2.1
      • 儿童2.2

我想将检测到的术语分配给类别树中的叶子。 e.g。

    • 类别1(word1)
      • 儿童1.1(word2,word4)
    • 第2类
      • 类别2.1(word4 word5)
      • 类别2.2(wordN)

该作业将是一本手册' (有意识的)从我这边开始操作,但我需要ES至少提供它检测到的常用短语/单词。

然后,当我搜索我的文档时,我希望Elasticsearch以某种方式将文档与我的树结构中的叶子(作为属性)相关联。

e.g:

{
  ...
  "Description": "word4 word5 word6",
  "Category": "Category 2.1" <-- by elasticsearch, based on 'word4 word5' in the Description
  ...
}

我想要使用所有这些,所以我可以通过&#39;类别&#39;在Kibana中可视化我的文档。

我是ES和Kibana的新手,我一般会怎么做?

0 个答案:

没有答案