我在index
中有一个Elasticsearch
,它存储每个数据集的突变:
[{
_index: "dataset_mutations#32345",
_type: "mutation",
start: "2344",
end: "2345",
...
},
{
_index: "dataset_mutations#32345",
_type: "mutation",
start: "22440",
end: "22441",
...
},
...]
#32345
是数据集编号。现在,我还要存储数据集的所有基因。我可以为其创建一个单独的索引,但是由于我有很多数据集,它们的所有dataset_mutations
和gene
索引都会混合在一起。在我看来,这似乎没有组织,但我不确定,这很新。对我来说,似乎为相同的数据集type
添加另一个index
会更好。但是,数据库全都与mutations
有关,并且可以看到它以索引本身的名称编码。因此,从语义上讲,在gene
索引下包含type
dataset_mutations
是错误的。另一个想法是重构数据库以使其具有dataset
索引,然后再具有两个类型mutation
和gene
。问题是gene
级别的数据与mutation
数据相比非常小,因此为了进行较小的语义扩展,它看起来像是重组。您对这里的最佳做法有何建议?