是否有一个类似于Vertica的列存储,它构建在Hadoop之上。我不是在讨论HBase,因为它是稀疏矩阵存储,无法获得像Vertica这样的压缩级别吗? / p>
由于
答案 0 :(得分:3)
你在找RCFile之类的东西吗?它是一种在内部使用柱状存储的文件类型。
答案 1 :(得分:1)
RCFile是一个好的开始。 RCFile以PAX布局存储数据 - 在块内可以与HDFS的块大小一样大。 VLDB 2011上有一篇论文描述了另一种列式存储格式here和一篇与RCFile here进行简短比较的博客文章。
答案 2 :(得分:0)
我没有使用Hadoop,但我知道Vertica一直在尝试与Hadoop集成。
http://www.vertica.com/the-analytics-platform/native-bi-etl-and-hadoop-mapreduce-integration/
答案 3 :(得分:0)
看看Hadapt http://hadapt.com/
这是HadoopDB http://db.cs.yale.edu/hadoopdb/hadoopdb.html的商业版本 在耶鲁大学开发。它可以与面向列的DB(安装在计算机集群的每个节点上)一起使用,同时利用Hadoop进行容错执行。