BigQuery表设计 - 混合事实和维度表?

时间:2018-03-23 13:29:42

标签: google-bigquery denormalization

我打算在BigQuery中存储多个维度表。 在规范化设计中,我将拥有包含引用一个或多个维度表的外键的事实表。

我已经阅读了一些关于非规范化的内容,我想知道我应该走多远。通常,人们会将事实和维度数据混合到BigQuery中的一个表中吗?

关于嵌套字段: 如果单个事实引用多个维度表,您是在每个维度表中都有嵌套列,还是只有一个事实表,然后使用连接?

2 个答案:

答案 0 :(得分:4)

  

通常,人们会将事实和维度数据混合到BigQuery中的一个表中吗?

是的!

  

如果单个事实引用多个维度表,您是否在每个维度表中都有嵌套列,或者只有一个事实表,然后使用联接?

您应该将维度数据嵌入事实数据中,反之亦然。

答案 1 :(得分:1)

是的,我经常在BigQuery中混合使用事实和维度数据。我发现这适用于经常重建的表。

我对将大小的日期分区表添加维度属性更加谨慎。在处理大型日期分区表时,我开始提出类似这样的问题...如果维度属性发生变化,我是否重新加载所有日期分区,仅重新加载最后N天等等。