关于在数据集市中填充事实表的想法

时间:2010-03-18 10:44:43

标签: database database-design data-warehouse etl

我正在寻找填充数据集市中事实表的想法。假设我有以下维度

  1. 医师
  2. 患者
  3. 日期
  4. geo_location
  5. patient_demography
  6. 测试
  7. 我使用了两个ETL工具来填充维度表 - Pentaho和Oracle Warehouse Builder。日期,患者人口统计和地理位置不会从运营商店中提取数据。所有维度表都有自己的新代理键。

    我现在想用患者访问的详细信息填充事实表。当患者在特定日期拜访医生时,他下令进行测试。这是事实表中的信息。还有其他措施,我为了简单起见而省略。

    我可以使用源系统中的事实表中的所有必需列创建单个连接。但是,我需要存储患者,医师,测试等维度表中的密钥。实现这一目标的最佳方法是什么?

    ETL工具可以帮忙吗?

    谢谢 克里希纳

1 个答案:

答案 0 :(得分:6)

每个维度表都应该有一个BusinessKey,用于唯一标识表行描述的对象(人员,日期,位置)。在加载事实表期间,您必须根据BusinessKey从维度表中查找PrimaryKey。您可以选择直接查找维度表,或者在加载事实表之前为每个维度创建一个键查找表。

Pentaho Kettle为此目的进行了“数据库值查找”(转换步骤)。您可能还想查看Kimball数据仓库ETL工具包的“交付事实表”部分。