我打算在BigQuery中存储多个维度表。 在规范化设计中,我将拥有包含引用一个或多个维度表的外键的事实表。
我已经阅读了一些关于非规范化的内容,我想知道我应该走多远。通常,人们会将事实和维度数据混合到BigQuery中的一个表中吗?
关于嵌套字段: 如果单个事实引用多个维度表,您是在每个维度表中都有嵌套列,还是只有一个事实表,然后使用连接?
答案 0 :(得分:4)
通常,人们会将事实和维度数据混合到BigQuery中的一个表中吗?
是的!
如果单个事实引用多个维度表,您是否在每个维度表中都有嵌套列,或者只有一个事实表,然后使用联接?
您应该将维度数据嵌入事实数据中,反之亦然。
答案 1 :(得分:1)
是的,我经常在BigQuery中混合使用事实和维度数据。我发现这适用于经常重建的表。
我对将大小的日期分区表添加维度属性更加谨慎。在处理大型日期分区表时,我开始提出类似这样的问题...如果维度属性发生变化,我是否重新加载所有日期分区,仅重新加载最后N天等等。