使用Python的AzureDataFactory增量加载

时间:2019-05-22 21:18:51

标签: python azure-data-factory incremental-load

如何使用python创建azure数据工厂以增加负载? 在创建活动或管道时我应该在哪里提到文件加载选项(Incremental Load:LastModifiedOn)?

我们可以通过选择“文件加载选项”来使用UI进行操作。但是如何使用python实用地做同样的事情?

用于datafactory的python api是否支持?

2 个答案:

答案 0 :(得分:0)

根据此blog,您只能通过设置modifiedDatetimeStartmodifiedDatetimeEnd属性来从ADF SDK获得增量加载功能。

您可以在azure_blob_dataset类的additional_properties中设置以上属性。

enter image description here

答案 1 :(得分:0)

我的调查表明,Python SDK尚未实现此功能。我使用SDK连接到现有实例,并获取了两个示例数据集。我没有发现任何看起来像“上次修改日期”的东西。我尝试了dataset.serialize()dataset.__dict__dataset.properties.__dict__。我也尝试过.__slots__

尝试serialize()很重要,因为在GUI中生成的JSON和Python生成的JSON之间应该保持奇偶校验。缺乏奇偶性表明SDK版本落后于GUI版本。

更新:产品组正在解决此问题。将在此处编辑更多信息。