将相关数据添加到Elasticsearch(架构问题)

时间:2019-05-20 22:18:29

标签: elasticsearch

我在index中有一个Elasticsearch,它存储每个数据集的突变:

    [{
      _index: "dataset_mutations#32345",
      _type: "mutation",
      start: "2344",
      end: "2345",
      ...
    }, 
    {
      _index: "dataset_mutations#32345",
      _type: "mutation",
      start: "22440",
      end: "22441", 
      ...
    },
    ...]

#32345是数据集编号。现在,我还要存储数据集的所有基因。我可以为其创建一个单独的索引,但是由于我有很多数据集,它们的所有dataset_mutationsgene索引都会混合在一起。在我看来,这似乎没有组织,但我不确定,这很新。对我来说,似乎为相同的数据集type添加另一个index会更好。但是,数据库全都与mutations有关,并且可以看到它以索引本身的名称编码。因此,从语义上讲,在gene索引下包含type dataset_mutations是错误的。另一个想法是重构数据库以使其具有dataset索引,然后再具有两个类型mutationgene。问题是gene级别的数据与mutation数据相比非常小,因此为了进行较小的语义扩展,它看起来像是重组。您对这里的最佳做法有何建议?

0 个答案:

没有答案