如何识别azure blob输入数据集

时间:2018-04-12 06:52:34

标签: azure azure-data-factory

这是我的文件模式:adm_domain_20180401,adm_domain_20180402,这些来自一个特定来源。同一文件夹还包含adm_agent_20180401,adm_agent_20180402。我想只使用前缀adm_domain将文件从blob复制到ADL,有没有办法在输入数据集中定义文件模式?

数据集:

{     " name":" CgAdmDomain",     "属性":{         "发布":false,         "输入":" AzureBlob",         " linkedServiceName":" flk_blob_dev_ls",         " typeProperties":{             " folderPath":"传入/ {日期} /",             "格式":{                 "输入":" TextFormat"             },             " partitionedBy":[                 {                     " name":" Date",                     "价值":{                         "输入":" DateTime",                         " date":" SliceStart",                         "格式":" yyyyMMdd"                     }                 }             ]         },         "可用性":{             "频率":"分钟",             "间隔":15         },         "外部":是的,         "政策":{}     } }

2 个答案:

答案 0 :(得分:0)

您使用的是ADF V1还是V2?我们正在努力在ADF V2中添加文件名通配符支持。

答案 1 :(得分:0)

fileFilter无法使用Azure Blob Storage。如果您正在查看内部部署的文件,那么您可以通过指定用于选择folderPath中的文件子集的过滤器而不是所有文件来实现此目的 - link

仅为Azure Blob Storage使用Azure Data Factory自定义活动实现此目的。通过自定义代码(.NET)实现逻辑,并将其作为管道中的活动。有关如何使用自定义活动的更多信息 - further reading