Azure数据工厂解压缩

时间:2018-04-16 09:39:59

标签: azure ftp azure-data-factory azure-data-factory-2

我有一个问题。我的FTP位置上有一些.zip文件,我想解压缩并将它们复制到ADLS。在文档中有明确的解释:

“从FTP服务器读取.zip文件,将其解压缩以获取文件,然后将这些文件放入Azure Data Lake Store。您可以将压缩类型为JSON的输入FTP数据集定义为ZipDeflate。”

我试过这个,在我的ADLS上我得到了压缩文件。我试图放置文件属性,定义分隔符和东西,并仍在数据湖存储上获取压缩文件。 我认为它是如何定义输出数据集的。如果输入数据集是来自FTP的.zip文件,是否有一些规则如何定义输出数据集。

1 个答案:

答案 0 :(得分:2)

您很可能也将输出数据集的压缩定义为ZipDeflate,这就是您在ADLS上获取压缩文件的原因。尝试更改输出数据集(与在ADLS中配置路径的位置相同),因此它不会使用压缩。您应该在复制活动中输入配置ftp的输入数据集,其中包含压缩和输出数据集,您可以在其中配置湖泊的大部分内容,而无需压缩。

通过这种方式,您告诉数据工厂获取压缩文件,并将其解压缩到ADLS上。

希望这有帮助!