构建gwas数组数据库

时间:2018-02-05 15:23:26

标签: mysql database relational-database

我有超过20K样本的实验gwas微阵列数据结果。每个样品的数值输出值约为1,000,000个标记。所以我有一个20000 x 1000000值的理论表。最终目标是创建Web服务,以显示少量样本的输出值。我有几十个变量来构建查询。我的问题是如何以有效的方式创建这种数据库。它的MySQL是这个数据量的最佳选择还是仅取决于服务器硬件?

提前致谢。

1 个答案:

答案 0 :(得分:0)

MariaDB ColumnStore 是要走的路。 服务器硬件对效率的影响仅 11%,而选择DBMS 的影响 74%

虽然MySQL(MariaDB基于行)完全能够处理大量数据,但ColumnStore DBMS将适合您的需求。

柱状数据库将数据存储在列而不是行中。 Row vs Column RDBMS

在基本级别,行存储非常适合事务处理。列存储非常适合高度分析的查询模型。行存储能够非常快速地写入数据,而列存储在为列的子集聚合大量数据时非常棒。

柱状数据库的一个好处是它疯狂的快速查询速度。在某些情况下,花费数分钟或数小时的查询将在几秒钟内完成。这使得柱状数据库成为查询繁重环境中的不错选择。但是,您必须确保您运行的查询非常适合于柱状数据库。

链接参考: Why Should I Check Out a MySQL-Based Column Database?

PS:MariaDB AX是分析的不错选择。