在加载事实表时分离插入和更新

时间:2013-10-29 13:45:36

标签: data-warehouse etl

我正在努力了解数据仓库的基本原理。 在加载事实表时,我发现了两个建议。

  1. 单独插入,加载期间更新
  2. 删除索引并在加载后构建它们。
  3. 跟随它们有什么好处?

1 个答案:

答案 0 :(得分:2)

简单的答案,不需要详细说明:

  1. 通常,您希望使用新数据(插入)或更改的数据(根据您对待更改的方式进行更新或插入)的不同内容

  2. 在更改表时需要重新创建索引,从而在加载每行数据后导致大量慢速索引重新创建。当您加载大量数据(这是数据仓库中的典型场景)时,您没有充分的理由显着减慢加载过程。因此,强烈建议在加载大量数据之前删除索引,并在完成加载后仅重新创建一次