我问的问题是mongodb是否可以用于以下数据格式。
**Header**
GSGT Version 1.9.4
Processing Date 12/28/2016 4:07 PM
Content GSAMD-24v1-0_20011747_A1.bpm
Num SNPs 700078
Total SNPs 700078
Num Samples 44
Total Samples 48
File 1 of 44
**Data**
Sample ID SNP Name Allele1 - Plus Allele2 - Plus Allele1 - AB Allele2 - AB
B01 1:100292476 A A A A
B01 1:101064936 A A A A
B01 1:103380393 G G B B
B01 1:104303716 G G B B
B01 1:104864464 C C B B
B01 1:106737318 T T A A
B01 1:109439680 A A A A
...
以上数据是一条数据记录,我将拥有数百万条此类记录。我想找到一个很好的数据库来存储这种数据。 MongoDB
是我想要使用的那个。一个这样的记录可以保存为一个文档。整个数据将保存到一个集合中。以下是数据结构的描述。
一条记录包括header
和data
两部分。 data
部分通常有700,000行。为了将它们保存到MongoDB
我建议将格式更改为json作为集合,如下所示:
{ "header":{
"GSGT Version": "1.9.4",
"Processing Date" : "12/28/2016 4:07 PM",
...
},
"data" : [{
"Sample ID": "B01",
"SNP Name": "1:100292476",
"Allele1 - Plus" : "A",
...
},{
"Sample ID": "B01",
"SNP Name": "1:100292476",
"Allele1 - Plus" : "A",
...
}
...
}
由于数据部分有700,000行,我对此设计并不自信。一个文档中嵌套数据的合理数量是多少?如果我在一个文档中保存这样的记录是否有利于查询,保存?或者我应该将这些数据分成两个集合吗?或者是否有比MongoDB更好的其他数据库来处理这种结构?
答案 0 :(得分:0)
是的,你可以。
Mongo支持丰富数据。
此外,您可以将它们编入索引以便更快地检索并将其嵌入到具体查询
中但您必须确保您的个人文档(记录)增长不超过 16兆字节