提取我的数据后会发生什么?

时间:2017-03-29 08:32:57

标签: etl data-warehouse business-intelligence

实际上,我有一个项目需要处理。我正在寻求帮助。 我的项目涉及商业智能和创建数据仓库。 我提取了我需要的数据(ETL),然后我该怎么办? 我正在使用MS SQL Server 2014。 如何创建我的尺寸和我的事实表? 寻找建议 请接受我的救恩。

1 个答案:

答案 0 :(得分:3)

这是一个很大的问题!不幸的是,Stack Overflow的Q& A格式并不是回答这个问题的最佳场所。但这里有一些指示:

  • 一切都从要求开始。在编写任何代码之前,请确切了解您的数据仓库将用于哪些内容(确定您的数据仓库不会用于哪些内容也很有帮助)。

  • 分析原始数据。确保您知道什么是可用的和不可用的。请注意源系统的缺点。示例:如果您的报告需要按国家/地区拆分客户,此数据是否可用?如果是这样,它是否一直填充(某些记录有 US ,其他美国,其他记录美国)?制定处理这些问题的计划(见下面的数据清理)。

  • 原型化您的数据模型。 Excel和Power BI是测试设计的好地方。一旦开始使用数据库,就会变得更加难以改变。一开始就做对,你的生活会更容易。

  • 选择一个ETL工具。确保您理解它,并发挥您和您团队的优势。我喜欢SSIS

  • 将原始数据导入staging tables。这有助于简化分析阶段。

  • Cleanse数据。在数据仓库中,您可以100%控制每一行,每列和单元格。利用这个事实。确保只有高质量,有用且合格的数据才能进入已发布的表格。

与所有项目一样,规划和管理是关键。编写代码和构建表是最后的。

以下是一些可以帮助您的资源:

  • Kimball Group。 Ralph Kimball字面上写了关于数据仓库的书(见下一篇技巧)。他公司的网站包含一些提示和技巧。

  • 如果您不能参加培训课程,请购买一本好书。我推荐这个one。这是一个很大的主题。博客和互联网只能教你这么多。

  • 下载并试用Adventure Works DW。这是一个由Microsoft构建的示例数据仓库和ETL包。它演示了一些可以在SSIS中使用的技术。