mongodb是否可用于保存此格式的文档或其他内容?

时间:2017-05-15 09:08:50

标签: mongodb database

我问的问题是mongodb是否可以用于以下数据格式。

**Header**
GSGT Version    1.9.4
Processing Date 12/28/2016 4:07 PM
Content         GSAMD-24v1-0_20011747_A1.bpm
Num SNPs        700078
Total SNPs      700078
Num Samples     44
Total Samples   48
File    1 of 44
**Data**
Sample ID       SNP Name        Allele1 - Plus  Allele2 - Plus  Allele1 - AB    Allele2 - AB
B01     1:100292476     A       A       A       A
B01     1:101064936     A       A       A       A
B01     1:103380393     G       G       B       B
B01     1:104303716     G       G       B       B
B01     1:104864464     C       C       B       B
B01     1:106737318     T       T       A       A
B01     1:109439680     A       A       A       A
...

以上数据是一条数据记录,我将拥有数百万条此类记录。我想找到一个很好的数据库来存储这种数据。 MongoDB是我想要使用的那个。一个这样的记录可以保存为一个文档。整个数据将保存到一个集合中。以下是数据结构的描述。

一条记录包括headerdata两部分。 data部分通常有700,000行。为了将它们保存到MongoDB我建议将格式更改为json作为集合,如下所示:

{ "header":{
     "GSGT Version": "1.9.4",
     "Processing Date" : "12/28/2016 4:07 PM",
     ...
   },
   "data" : [{
      "Sample ID": "B01",
      "SNP Name": "1:100292476",
      "Allele1 - Plus" : "A",
       ...
     },{
       "Sample ID": "B01",
      "SNP Name": "1:100292476",
      "Allele1 - Plus" : "A",
      ...
     }
   ...
   }

由于数据部分有700,000行,我对此设计并不自信。一个文档中嵌套数据的合理数量是多少?如果我在一个文档中保存这样的记录是否有利于查询,保存?或者我应该将这些数据分成两个集合吗?或者是否有比MongoDB更好的其他数据库来处理这种结构?

1 个答案:

答案 0 :(得分:0)

是的,你可以。

Mongo支持丰富数据

此外,您可以将它们编入索引以便更快地检索并将其嵌入到具体查询

但您必须确保您的个人文档(记录)增长不超过 16兆字节