识别数据模型粒度

时间:2016-07-13 20:04:50

标签: data-modeling data-warehouse star-schema

我目前正致力于设计和实施银行数据仓库的项目。我想为会计数据集市定义数据模型,定义粒度并使用星型模型对其进行建模。我被告知,我们对客户分支中注册帐户的交易感兴趣... (某些其他方面).....在某个日期。但他们要求 DAILY 交易!我的观点是,在数据仓库中进行日常事务是没有意义的,因为它将是事务数据库的精确副本!这个数据仓库将用于制作仪表板我的猜测是决策者没有这些详细数据。你怎么看 ?

谢谢。

2 个答案:

答案 0 :(得分:1)

将日粮用于您的时间维度并考虑以下因素:

仓库不是交易数据库的副本,即使两者中都有相同的信息。仓库针对分析进行了优化,它包含所有历史记录,非易失性,并沿维度聚合数据。

在您的示例中,仓库可能只有一行代表一天内发生的许多交易,因此它不会复制谷物。它可能包含五年前从交易系统中清除的信息。在查询中汇总金额会很快。它的使用不会给您的交易系统带来负担。有一天,当您的公司与另一家公司合并时,它可能包含来自另一个交易数据库的信息。或者,可以使用从一个或多个社交网络导入的数据来增强客户信息。

关键是,不要忽视仓库中的细粒度数据,这对交易系统来说似乎是多余的。它很有用,也很常见。

答案 1 :(得分:0)

尺寸建模的原则是始终以最精细的纹理进行建模。我从来没有想过在不到一天的时间内建模交易,我甚至会尝试时间(虽然这可能是一个单独的维度)。