为什么数据仓库时间依赖?

时间:2017-04-22 05:25:34

标签: data-warehouse

在我的教科书中,它说数据仓库中的数据只在一段时间内有效,换句话说,它被认为是时间依赖的,但根据数据仓库的四个特征,非易失性属性表示一旦数据输入数据仓库,就不能不惜任何代价进行更改。

那么数据仓库的其他任何属性是否与时间有关?

1 个答案:

答案 0 :(得分:0)

您的教科书是否说“时间依赖”或“时间变量”?它可能是比尔Inmon的定义,即数据仓库面向主题,集成,时变和非易失性。

“时间变量”表示数据仓库完全包含在一段时间内。说明这一点的另一种方式是DW在一段时间内是一致的,这意味着数据仓库每天,每小时或其他一些周期性加载,并且在该时间段内不会发生变化。

请记住,这些要求是在1992年编写的,25年后,当实时数据仓库成为现实时,它们有点难以支持,并且数据仓库可能每秒更改几次。

另外,要注意“非易失性”的定义。有些人将其解释为数据永远不会改变,但这又是一个过时的概念。显示订单预测发货日期的累积快照事实表可能会在订单生命周期内多次更新。当然,这取决于事实的目的 - 如果要衡量预测日期的波动性,我们会保留每一个变化,但如果要衡量订单在整个生命周期中的流量,我们只需更新它

就个人而言,我更喜欢Ralph Kimball的定义,“数据仓库是专门为查询和分析而构建的交易数据的副本。”更清楚,更明确。