在阅读文章
时,我会经常看到“增量加载”这个词真正(技术上)意味着什么?这意味着什么?
欢迎使用用例解释。
答案 0 :(得分:11)
它通常意味着仅将自上次加载以来已更改的记录(插入,更新等)加载到仓库中;而不是将所有数据(所有记录,包括自上次加载后未更改的记录)完全加载到仓库中。
优势在于它减少了从系统传输到系统的数据量,因为完全加载可能需要数小时/天才能完成,具体取决于数据量。
主要缺点是可维护性。在满载的情况下,如果出现错误,您可以重新运行整个负载,而无需在清理/准备方面做太多其他事情。使用增量加载时,通常需要按顺序加载文件。因此,如果您对一个批次有问题,其他人会在其后排队直到您更正它。或者,您可能会在几天前发现批次中的错误,并且需要在更正后重新加载该批次,然后是每个后续批次,以确保仓库中的数据一致。
答案 1 :(得分:1)
将数据从一个存储库(数据库)移动到另一个存储库(数据库)时使用增量加载。
非增量加载是指目标将来自源的全部数据推送到它。
增量只会传递新的和修正的数据。
一个具体的例子:
公司可能有两个平台,一个 处理订单,单独处理 会计系统。帐户 部门输入新的客户详细信息 进入会计系统,但必须 确保这些客户出现在 订单处理系统。
要执行此操作,它会运行每晚批处理作业 从会计中发送数据 系统到订单系统。
如果他们正在删除所有客户 订单系统和细节 为所有客户补充费用 会计系统然后他们会 执行非增量负载。
如果他们只发送了新的 客户和拥有的客户 他们将改变他们的表现 增量负荷。