数据仓库中事实表的复合索引 - datamart

时间:2014-01-26 20:38:14

标签: oracle data-warehouse dimensional-modeling

最佳做法是在Oracle EDW - 数据集市中的事实表上保留复合唯一索引以避免重复吗?它会影响ETL数据加载性能吗?请提供您对此主题的看法。有哪些其他替代方法可以获得ETL负载的SLA?

1 个答案:

答案 0 :(得分:1)

每次插入到具有索引的表中都会导致该索引被更新,从而导致IO并将其减慢一点。因此,加载到具有索引的表是否唯一或不会更慢。您可以删除该索引,加载然后再次创建它。它将减少索引碎片,通常在大负载时会更快。

我很惊讶在事实表上看到一个唯一索引。通常,那里不需要那么多的唯一性,并且通常数据仓库会对数据进行非规范化和复制。

一切都取决于你的情况。如果您可以使用ETL来避免不需要的重复,请执行此操作而不是使用索引。如果唯一目的是数据完整性/一致性,请不要创建此索引。索引变得非常庞大,因此它们对您的查询更有用。