应用错误收集

Hadoop上的TPC-DS BenchMark - 为什么要使用星型模式

时间：2015-07-01 23:14:57

标签： hadoop benchmarking apache-spark-sql

我正在尝试使用sparksql运行tpc-ds基准测试。

在文档中，他们讨论了星型模式和表格数量。

根据我对hadoop的理解，更好地使用非规范化数据，然后你可以像压缩方式那样格式化。（使用并行分区）

我也从SAS发现了这个文件 - ＆gt; https://support.sas.com/resources/papers/data-modeling-hadoop.pdf

也在同一个词中谈论。我不是数据仓库专家，所以我会请求，帮助我了解如何为hadoop中的数据仓库建模数据

0 个答案:

没有答案