“增量负荷”是什么意思?

时间:2010-12-17 14:03:50

标签: database terminology data-warehouse

在阅读文章

时,我会经常看到“增量加载”这个词

真正(技术上)意味着什么?这意味着什么?

欢迎使用用例解释。

2 个答案:

答案 0 :(得分:11)

它通常意味着仅将自上次加载以来已更改的记录(插入,更新等)加载到仓库中;而不是将所有数据(所有记录,包括自上次加载后未更改的记录)完全加载到仓库中。

优势在于它减少了从系统传输到系统的数据量,因为完全加载可能需要数小时/天才能完成,具体取决于数据量。

主要缺点是可维护性。在满载的情况下,如果出现错误,您可以重新运行整个负载,而无需在清理/准备方面做太多其他事情。使用增量加载时,通常需要按顺序加载文件。因此,如果您对一个批次有问题,其他人会在其后排队直到您更正它。或者,您可能会在几天前发现批次中的错误,并且需要在更正后重新加载该批次,然后是每个后续批次,以确保仓库中的数据一致。

答案 1 :(得分:1)

将数据从一个存储库(数据库)移动到另一个存储库(数据库)时使用增量加载。

非增量加载是指目标将来自源的全部数据推送到它。

增量只会传递新的和修正的数据。

一个具体的例子:

  

公司可能有两个平台,一个   处理订单,单独处理   会计系统。帐户   部门输入新的客户详细信息   进入会计系统,但必须   确保这些客户出现在   订单处理系统。

     

要执行此操作,它会运行每晚批处理作业   从会计中发送数据   系统到订单系统。

     

如果他们正在删除所有客户   订单系统和细节   为所有客户补充费用   会计系统然后他们会   执行非增量负载。

     

如果他们只发送了新的   客户和拥有的客户   他们将改变他们的表现   增量负荷。