在Azure数据工厂中解压缩gzip文件

时间:2019-11-26 14:00:50

标签: azure-data-factory

我想知道是否有可能在ADF中设置一个病源来解压缩gzip文件并显示提取的txt文件。发生的情况是,在源/接收器都进行gzip压缩的地方,接收器定义不正确。

所以最后是“ fil1.gz”现在是“ file1.gz.gz”。

这是文件在Azure blob中的外观: enter image description here

这是文件在S3存储桶中的外观(末尾被截断,但末尾是“ txt.gz”): enter image description here

我看到COPY中有Zipdeflate和deflate压缩,但是我得到一个错误,它不支持这种活动。

我在ADF管道中创建了一个接收器,尝试将其解压缩。在数据源屏幕中,我使用了Zipdeflate,但是它使用“ deflate”扩展名而不是'txt'放置文件名。

enter image description here

谢谢

1 个答案:

答案 0 :(得分:0)

创建一个“复制数据”对象 资源: 由于扩展名为gz,因此应选择GZip作为压缩类型,勾选二进制副本 目标: Blob存储二进制 压缩-无

这种复制管道将解压缩您的文本文件