将数据从Azure Blob复制到Azure Data Lake的最佳(快速)方法

时间:2017-11-12 01:01:45

标签: azure azure-storage-blobs azure-data-factory azure-data-lake

将数据从Azure blob复制到Azure Data Lake存储的最佳(和快速)方法是什么?这份副本是一次性工作。数据集大约为50 G,包含大约10个文件。每个文件大约有20列。

我查看了Azure数据工厂,它需要为Azure数据工厂中的每个文件创建日期集。这非常乏味。

2 个答案:

答案 0 :(得分:2)

您可以使用AdlCopy将Azure存储Blob复制到Azure Data Lake Store。

答案 1 :(得分:0)

作为遇到这个问题的人的当代答案。

这取决于您指的是“发展速度”还是“转移速度”。

我怀疑是根据您对数据工厂的关注而发展的速度。

Data Factory现在具有“复制数据向导”,可以快速设置这些内容。

从问题的年龄来看,这很可能在Data Factory V1的时间范围内。 Data Factory V2现已推出,而且容易得多。

Copy Data Wizard

https://docs.microsoft.com/en-gb/azure/data-factory/quickstart-create-data-factory-copy-data-tool

关于传输速度,Data Factory发布了以下统计数据,因此传输速度约为105MB / s,我怀疑更快。

transfer speeds for data factory between blob storage and ADLS

对于Azure Data Lake Gen2,文档中不再提到AdlCopy,而是提到了AzCopy。

我知道您已经回答了您的问题,但是以防万一将来人们遇到这个问题。