我有一个大学任务要求,为产品库存管理构建数据仓库,这可以帮助库存管理了解现有价值,并使用他们可以预测何时带来新库存的历史数据。我一直在阅读以找出使用Cubes或Data mart的最佳方法。我的问题是,我必须首先创建一个数据仓库,然后在构建的Cube,Data mart或我可以直接将事务数据提取到Cube / Data Mart中。
接下来,是否必须构建一个星型模式(或其他DW模式)来执行此分配,因为在阅读多篇文章后,我的理解是OLAP多维数据集可以包含由Dimensions包围的多个事实。
答案 0 :(得分:4)
你的问题比你知道的要大得多!
作为一般原则,您将拥有一个登台数据库,用于从一个或多个OLTP系统登陆数据。然后,临时数据库将数据提供给数据仓库(DWH)。在DWH之上将构建一些Marts,这些Marts通常是特定于主题区域的。
有几种DWH方法
重要的是不要混淆DWH方法和实现DWH的技术,尽管有时候某些技术适合特定的方法。例如,OLAP多维数据集可以使用Kimball星型模式轻松工作。没有特别需要将关系技术用于特定数据库。一些NoSQL数据库(如Cassandra)可以很好地为数据库升级。
回答您的具体问题
我是否必须首先创建数据仓库 顶部的内置Cube,数据集市或我可以直接提取 交易数据进入Cube / Data Mart。
如果您有针对报告量身定制的特定商城,则OLAP多维数据集是可选的,但这取决于您的报告和分析要求以及访问速度。 实际上,数据集市只能使用OLAP多维数据集构建,直接来自DWH。
特别是在库存管理方面,所有这些DWH方法都是合适的。
我无法回答你的上一个问题,因为这似乎是作业的重点,你没有提供足够的信息来回答这个问题,但是你需要对dimensional modelling做一些研究,所以我希望这能指出你正确的方向!
答案 1 :(得分:1)
答案是肯定的,星型模型总是有助于更好的分析,但它是关系型的,多维数据集是多维的(它执行所有数据交叉)并且经常用作星型模型的数据源(推荐)。 / p>
OLAP多维数据集通常用于快速分析和数据汇总。
因此,按照标准,我建议您制作所需的所有星型模型,然后生成OLAP多维数据集以供分析。
答案 2 :(得分:1)
这是一个'家庭作业'问题,我猜这位讲师正在寻找Kimball和Inmon之间的优缺点,这两者是默认的'最终用户报告的设计。在现实世界中,DataVault也可以作为DWH策略的一部分应用,但它具有不同的用途,不建议最终用户使用。
DataVault是一种设计模式,可以从源系统中不受干扰地传入数据。在呈现给最终用户解决方案之前,数据将不可避免地需要进行清理,如果发现任何问题或业务需求发生变化,DV允许DWH ETL流程重新运行,尤其是在粒度级别下降的情况下(例如原始数据)事实表用于销售,维度要求是销售人员和产品类别,现在他们想要销售轮次的事实销售和产品子类别和类别的销售员。没有DV,您没有粒度数据来重播历史信息并重建DWH)