将数据从Azure blob复制到Azure Data Lake存储的最佳(和快速)方法是什么?这份副本是一次性工作。数据集大约为50 G,包含大约10个文件。每个文件大约有20列。
我查看了Azure数据工厂,它需要为Azure数据工厂中的每个文件创建日期集。这非常乏味。
答案 0 :(得分:2)
您可以使用AdlCopy将Azure存储Blob复制到Azure Data Lake Store。
答案 1 :(得分:0)
作为遇到这个问题的人的当代答案。
这取决于您指的是“发展速度”还是“转移速度”。
我怀疑是根据您对数据工厂的关注而发展的速度。
Data Factory现在具有“复制数据向导”,可以快速设置这些内容。
从问题的年龄来看,这很可能在Data Factory V1的时间范围内。 Data Factory V2现已推出,而且容易得多。
https://docs.microsoft.com/en-gb/azure/data-factory/quickstart-create-data-factory-copy-data-tool
关于传输速度,Data Factory发布了以下统计数据,因此传输速度约为105MB / s,我怀疑更快。
对于Azure Data Lake Gen2,文档中不再提到AdlCopy,而是提到了AzCopy。
我知道您已经回答了您的问题,但是以防万一将来人们遇到这个问题。