我必须使用数据工厂承担增量负载

时间:2019-03-13 16:41:31

标签: azure-data-factory

我正在增量加载数据,而我没有在数据中添加时间戳的方法。

1 个答案:

答案 0 :(得分:0)

您要么必须:

A。在每个表中标识一个要用来确定行是否已更改的字段  B.在源数据上实现某种变更捕获功能

实际上,只有这两种方法可以限制从源中提取的数据量。

效率不是很高,但是如果您只是尝试不更新目标中未更改的行,则可以对源值进行哈希处理并对目标中的值进行哈希处理,并且仅插入/更新行哈希值不匹配的地方。这是an example在T-SQL中的工作方式。

有一个section of the Data Factory documentation专门用于增量加载数据。如果还没有,请检查一下。