Azure数据工厂切片

时间:2016-03-04 19:28:40

标签: azure azure-data-factory

网上有很多演示文稿,对myblobcontainer/{Year}/{Month}/{Day}格式或类似格式(即https://azure.microsoft.com/en-gb/documentation/articles/data-factory-scheduling-and-execution/)的blob进行切片。

现在很明显,这样可以很容易地对数据进行切片,因为年月和日的参数已经明确定义了。

我所拥有的是更像这样的文件:

myblobcontainer/log_20151231_144229.csv

显然是YYYYMMDD_HHMMSS

我想每小时处理一次我的文件,而不是重新处理任何内容,理想情况下不必过多地重构我的blob。

有没有人知道我怎么能"阅读"只有这些文件属于我的小时片?

1 个答案:

答案 0 :(得分:1)

Blob数据集中的folderPath可用作路径前缀。因此,您可以将folderPath设置为"$$Text.Format('myblobcontainer/log_{0:yyyyMMdd}', WindowStart)",并且将复制满足前缀的所有文件。