Question

我在index中有一个Elasticsearch，它存储每个数据集的突变：

    [{
      _index: "dataset_mutations#32345",
      _type: "mutation",
      start: "2344",
      end: "2345",
      ...
    }, 
    {
      _index: "dataset_mutations#32345",
      _type: "mutation",
      start: "22440",
      end: "22441", 
      ...
    },
    ...]

#32345是数据集编号。现在，我还要存储数据集的所有基因。我可以为其创建一个单独的索引，但是由于我有很多数据集，它们的所有dataset_mutations和gene索引都会混合在一起。在我看来，这似乎没有组织，但我不确定，这很新。对我来说，似乎为相同的数据集type添加另一个index会更好。但是，数据库全都与mutations有关，并且可以看到它以索引本身的名称编码。因此，从语义上讲，在gene索引下包含type dataset_mutations是错误的。另一个想法是重构数据库以使其具有dataset索引，然后再具有两个类型mutation和gene。问题是gene级别的数据与mutation数据相比非常小，因此为了进行较小的语义扩展，它看起来像是重组。您对这里的最佳做法有何建议？

将相关数据添加到Elasticsearch（架构问题）

0 个答案: