如何下载tar.gz并将其重新粘贴到hdfs而无需将整个文件下载到本地磁盘?

时间:2018-04-03 13:03:26

标签: hadoop hdfs command-line-interface tar

我想从web直接将tar.gz文件提取到hdfs中。 跳过下载到本地磁盘的阶段,因为文件可能非常大。

这一切都来自简单的cmd行脚本(bash,wget等)

1 个答案:

答案 0 :(得分:2)

好的,看起来这个衬里有效:

wget -O - http://...tar.gz | tar xfz - --to-stodout | hadoop dfs -put - /somepath