我已经在网络上的任何地方搜索过,以了解如何将数据导入星型模式数据仓库。网上很多东西都解释了星型模式和数据仓库的设计,但没有一个解释数据是如何加载到DW中的。这是我到目前为止所做的:
我正在努力为每位球员申请高中篮球统计数据。
我有:
我认为统计数据是我的事实表,其余的是我的昏暗表。
现在是一个百万美元的问题 - 世界上如何将数据恰当地转换成这种格式?
我尝试将它们导入到各自的表中,但不知道它们是如何连接的。
示例:有800名球员和400所学校。每所学校都有一个唯一的ID(主键)。我将玩家上传到昏暗的玩家和学校,进入昏暗的学校。现在我该如何连接它们?
请帮忙。提前致谢。抱歉漫无边际:)
答案 0 :(得分:1)
将数据导入数据库的方法有很多种:使用内置加载器,脚本或主要用于DW环境的ETL工具。
关于您的事实表,我认为统计数据是指标,而不是交易。换句话说,您衡量的是交易,而不是指标本身。
答案 1 :(得分:1)
使用ETL工具(E-从您的帐户中提取数据,T-转换数据或根据需要对其进行操作,L - 在DW中加载数据)您可以安全可靠地加载数据你的DW。
您可以使用以下ETL工具:SSIS,Talend等。
答案 2 :(得分:0)
是的," star"," dim"," fact","数据仓库"是适当的条款,但我宁愿从"实体"和"关系" ...
您基本上定义了5"实体"。每个实体(通常)表现为一个数据库表。写下CREATE TABLEs
。请务必为每个人添加PRIMARY KEY
;它将唯一标识表中的每一行。
现在想想关系。想想1:很多,例如1所高中有很多'玩家。想想很多:很多。
对于1:很多,例如,您将高中的id
作为player
表中的一列。
对于很多人:很多人需要extra table。为CREATE TABLEs
写下您可能需要的任何内容。
现在,阅读数据,并在适当的表格中执行INSERTs
。
之后,您可以考虑SELECTs
来提取有趣的数据。同时,确定INDEX(es)
将有用的内容。但这是另一个讨论。
当你们全部完成后,你们将学到很多关于SQL的知识,并且可能会意识到某些事情应该以不同的方式完成。所以,准备好重新开始。把它想象成一种学习练习。
答案 3 :(得分:-1)
您可以将SQL Server数据工具用于此项目。 SQL服务器数据工具由SSIS,SSAS和SSRS组成。
使用SSIS为数据库中的数据创建ETL过程。 使用SSAS创建维度,事实表和多维数据集(您可以在此处执行更多操作)。 使用SSRS以用户友好的方式呈现数据。
youtube提供了很多视频。