我正在增量加载数据,而我没有在数据中添加时间戳的方法。
答案 0 :(得分:0)
您要么必须:
A。在每个表中标识一个要用来确定行是否已更改的字段 B.在源数据上实现某种变更捕获功能
实际上,只有这两种方法可以限制从源中提取的数据量。
效率不是很高,但是如果您只是尝试不更新目标中未更改的行,则可以对源值进行哈希处理并对目标中的值进行哈希处理,并且仅插入/更新行哈希值不匹配的地方。这是an example在T-SQL中的工作方式。
有一个section of the Data Factory documentation专门用于增量加载数据。如果还没有,请检查一下。