如何将数据导入星型模式数据仓库。

时间:2014-07-04 05:59:44

标签: mysql database data-warehouse star-schema fact-table

我已经在网络上的任何地方搜索过,以了解如何将数据导入星型模式数据仓库。网上很多东西都解释了星型模式和数据仓库的设计,但没有一个解释数据是如何加载到DW中的。这是我到目前为止所做的:

我正在努力为每位球员申请高中篮球统计数据。

我有:

  1. 所有球员姓名,身高,位置和数量的列表
  2. 所有高中的名单
  3. 所有时间表的列表
  4. 会议列表
  5. 本年度每位球员的统计数据(积分,篮板,抢断,比赛等)。
  6. 我认为统计数据是我的事实表,其余的是我的昏暗表。

    现在是一个百万美元的问题 - 世界上如何将数据恰当地转换成这种格式?

    我尝试将它们导入到各自的表中,但不知道它们是如何连接的。

    示例:有800名球员和400所学校。每所学校都有一个唯一的ID(主键)。我将玩家上传到昏暗的玩家和学校,进入昏暗的学校。现在我该如何连接它们?

    请帮忙。提前致谢。抱歉漫无边际:)

4 个答案:

答案 0 :(得分:1)

将数据导入数据库的方法有很多种:使用内置加载器,脚本或主要用于DW环境的ETL工具。

关于您的事实表,我认为统计数据是指标,而不是交易。换句话说,您衡量的是交易,而不是指标本身。

答案 1 :(得分:1)

使用ETL工具(E-从您的帐户中提取数据,T-转换数据或根据需要对其进行操作,L - 在DW中加载数据)您可以安全可靠地加载数据你的DW。

您可以使用以下ETL工具:SSIS,Talend等。

答案 2 :(得分:0)

是的," star"," dim"," fact","数据仓库"是适当的条款,但我宁愿从"实体"和"关系" ...

您基本上定义了5"实体"。每个实体(通常)表现为一个数据库表。写下CREATE TABLEs。请务必为每个人添加PRIMARY KEY;它将唯一标识表中的每一行。

现在想想关系。想想1:很多,例如1所高中有很多'玩家。想想很多:很多。

对于1:很多,例如,您将高中的id作为player表中的一列。

对于很多人:很多人需要extra table。为CREATE TABLEs写下您可能需要的任何内容。

现在,阅读数据,并在适当的表格中执行INSERTs

之后,您可以考虑SELECTs来提取有趣的数据。同时,确定INDEX(es)将有用的内容。但这是另一个讨论。

当你们全部完成后,你们将学到很多关于SQL的知识,并且可能会意识到某些事情应该以不同的方式完成。所以,准备好重新开始。把它想象成一种学习练习。

答案 3 :(得分:-1)

您可以将SQL Server数据工具用于此项目。 SQL服务器数据工具由SSIS,SSAS和SSRS组成。

使用SSIS为数据库中的数据创建ETL过程。 使用SSAS创建维度,事实表和多维数据集(您可以在此处执行更多操作)。 使用SSRS以用户友好的方式呈现数据。

youtube提供了很多视频。