企业数据仓库 - EDW表的名称是否与源系统中的名称相同

时间:2016-11-09 16:44:50

标签: data-warehouse enterprise

因此我们正在使用多个电子病历系统加载EDW。我们为每个源系统提供一个数据库,内部称为源集市。然后我们将类似的数据合并到另一个名为Essentials的数据库中。

我很好奇在源集市命名表的最佳实践。我认为他们应该保持与源系统完全相同的名称。这样,当移植应用程序时,我们可以映射到某种级别的血统。现有系统上的开发人员会知道表PAT_REF是两个系统上的患者数据,并且不必维护第二个字典来确定该表已被命名为其他字符。

但是,一旦我们将来自多个系统的表合并到Essentials数据库中,我们就会根据使用数据所涉及的数据治理方法重新命名表。

我可以发誓我在其中一个bazillion最佳实践文档中看到了这一点,但我似乎只是发现文档在第一级数据的标准化步骤。我没有看到尝试在该级别设计事实和维度,然后尝试将它们与其他源系统合并。更不用说我们放在源服务器上的那些规范化查询了。

1 个答案:

答案 0 :(得分:1)

我们在暂存区域中使用与源系统中相同的表名。 要将它们加载到组合数据仓库中,我们编写视图来定义源系统的关系和依赖关系。然后在数据仓库中,表名反映了用于加载它们的视图的名称。