有人能给我一个关于数据仓库的实用定义吗?
答案 0 :(得分:3)
我刚开始使用Datawarehousing和Buisness Intelligence并浏览网页,您可以找到一些有趣的链接:
我认为这两个链接可以帮助您理解数据仓库的概念。
抱歉,即时通讯我只能发布一个链接^^我们很抱歉,但作为垃圾邮件防护机制,新用户最多只能发布一个超链接。获得10个声望以发布更多超链接。
答案 1 :(得分:2)
我很惊讶没有人发布Inmon's definition:
仓库是面向主题的, 综合,时变和 非易失性数据收集 支持管理层的决定 制作过程
在同一页面上,你可以选择Kimball的定义:
交易数据的副本 专门用于查询和 分析
不幸的是,我认为数据仓库是一个广泛的领域。有很多种类很少有标准范例,特别是我正在考虑Kimball的维度建模。 Inmon没有像Kimball那样具体的方法,因此一些3NF模型可能符合也可能不符合他的原则。
因为Inmon扩大了仓库要实现的范围,所以它可以包含非结构化数据。但是,非结构化数据的分析与传统分析有很大不同。
应用于SQL Server时,通常SQL Server上最大的数据仓库是按维度建模的,因为这非常适合非分布式,非大规模并行模型。像Teradata这样的大规模并行系统通常在3NF模型下表现更好。这些仍然是基于表的系统,其中各种表与外键约束相关联(可能没有强制执行,但至少是逻辑上的。)
当然,我们也看到像Map / Reduce这样的NoSQL数据处理系统,它们在规范化,非规范化或非规范化的关系数据库意义上都不是真正的数据库,我们已经有40年了。 / p>
答案 2 :(得分:1)
为检索而优化的数据库,通常是非规范化数据,通常是星型模式(但可能是雪花)并使用维度建模(事实和维度表)
答案 3 :(得分:0)
虽然这不是一个学术定义,但它可能是一个实际的定义。数据仓库是数据集合的集合,它将在组织的广度上组合数据集。
数据集市将包含特定于业务某些部分的数据集。在datamart中,您可以找到事实表,可测量的信息,以及尺寸,可测量部分的属性。
真正的数据仓库将具有一致的维度表,可以跨数据集共享。
一个例子......
贵公司可能围绕销售建立数据智能。另一个围绕人力资源的数据集市。如果客户维度表在这两个数据集中共享,则将其视为一致的维度。所有这三个实体一起组成一个数据仓库。
正如其他人所说,您可以通过搜索Ralph Kimball的数据策略找到更详细的信息。
答案 4 :(得分:-1)