这是我的文件模式:adm_domain_20180401,adm_domain_20180402,这些来自一个特定来源。同一文件夹还包含adm_agent_20180401,adm_agent_20180402。我想只使用前缀adm_domain将文件从blob复制到ADL,有没有办法在输入数据集中定义文件模式?
数据集:
{ " name":" CgAdmDomain", "属性":{ "发布":false, "输入":" AzureBlob", " linkedServiceName":" flk_blob_dev_ls", " typeProperties":{ " folderPath":"传入/ {日期} /", "格式":{ "输入":" TextFormat" }, " partitionedBy":[ { " name":" Date", "价值":{ "输入":" DateTime", " date":" SliceStart", "格式":" yyyyMMdd" } } ] }, "可用性":{ "频率":"分钟", "间隔":15 }, "外部":是的, "政策":{} } }
答案 0 :(得分:0)
您使用的是ADF V1还是V2?我们正在努力在ADF V2中添加文件名通配符支持。
答案 1 :(得分:0)
fileFilter
无法使用Azure Blob Storage
。如果您正在查看内部部署的文件,那么您可以通过指定用于选择folderPath
中的文件子集的过滤器而不是所有文件来实现此目的 - link
仅为Azure Blob Storage
使用Azure Data Factory
自定义活动实现此目的。通过自定义代码(.NET)实现逻辑,并将其作为管道中的活动。有关如何使用自定义活动的更多信息 - further reading。