DataWarehouse - 什么是好的定义?

时间:2010-05-21 01:10:29

标签: sql-server data-warehouse

有人能给我一个关于数据仓库的实用定义吗?

5 个答案:

答案 0 :(得分:3)

我刚开始使用Datawarehousing和Buisness Intelligence并浏览网页,您可以找到一些有趣的链接:

我认为这两个链接可以帮助您理解数据仓库的概念。

抱歉,即时通讯我只能发布一个链接^^

我们很抱歉,但作为垃圾邮件防护机制,新用户最多只能发布一个超链接。获得10个声望以发布更多超链接。

答案 1 :(得分:2)

我很惊讶没有人发布Inmon's definition

  

仓库是面向主题的,   综合,时变和   非易失性数据收集   支持管理层的决定   制作过程

在同一页面上,你可以选择Kimball的定义:

  

交易数据的副本   专门用于查询和   分析

不幸的是,我认为数据仓库是一个广泛的领域。有很多种类很少有标准范例,特别是我正在考虑Kimball的维度建模。 Inmon没有像Kimball那样具体的方法,因此一些3NF模型可能符合也可能不符合他的原则。

因为Inmon扩大了仓库要实现的范围,所以它可以包含非结构化数据。但是,非结构化数据的分析与传统分析有很大不同。

应用于SQL Server时,通常SQL Server上最大的数据仓库是按维度建模的,因为这非常适合非分布式,非大规模并行模型。像Teradata这样的大规模并行系统通常在3NF模型下表现更好。这些仍然是基于表的系统,其中各种表与外键约束相关联(可能没有强制执行,但至少是逻辑上的。)

当然,我们也看到像Map / Reduce这样的NoSQL数据处理系统,它们在规范化,非规范化或非规范化的关系数据库意义上都不是真正的数据库,我们已经有40年了。 / p>

答案 2 :(得分:1)

为检索而优化的数据库,通常是非规范化数据,通常是星型模式(但可能是雪花)并使用维度建模(事实和维度表)

答案 3 :(得分:0)

虽然这不是一个学术定义,但它可能是一个实际的定义。数据仓库是数据集合的集合,它将在组织的广度上组合数据集。

数据集市将包含特定于业务某些部分的数据集。在datamart中,您可以找到事实表,可测量的信息,以及尺寸,可测量部分的属性。

真正的数据仓库将具有一致的维度表,可以跨数据集共享。

一个例子......

贵公司可能围绕销售建立数据智能。另一个围绕人力资源的数据集市。如果客户维度表在这两个数据集中共享,则将其视为一致的维度。所有这三个实体一起组成一个数据仓库。

正如其他人所说,您可以通过搜索Ralph Kimball的数据策略找到更详细的信息。

答案 4 :(得分:-1)

定义:数据仓库是用于分析目的而非事务处理的数据库

有关数据仓库的更多信息,请查看以下链接

http://www.idatastage.com/datawarehouse/