我有一个相当简单的数据模型,它由2个事实表和2个维度表的星型模式组成:
Fact 1 - Revenue
Fact 2 - Purchases
Dimension 1 - Time
Dimension 2 - Product
这些表的粒度级别不同-意味着给定的日期可能在许多产品中有很多行。特定日期和产品可能有收入,但没有购买。同样,它可能有购买但没有收益。
每个事实都包含两个维度,其中包含产品名称,产品类别等其他详细信息。
我想做的是结合这两个事实,以便我可以一起报告收入和购买情况(例如,按日期,按产品或按日期和产品组合):
我可以非常了解数据混合,但是我遇到的问题是数据混合仅支持伪“内部联接”。如您所见,如果将这些数据源中的任何一个指定为主要数据源,那么没有购买/收入的日期将导致辅助数据源中的行减少。
在不导致记录下降的情况下融合这些数据的最佳方法是什么