我正试图在S3 / aws&上点击一个zip文件。将输出写入具有相同文件名的新位置
我在s3下面使用,这是将第一个CAT命令的流输出写入hdfs输出的正确方法吗?
hadoop fs -cat s3://analytics/LZ/2017/03/03/test_20170303-000000.tar.gz | zgrep -a -E '*word_1*|*word_2*|word_3|word_4' | hadoop fs -put - s3://prod/project/test/test_20170303-000000.tar.gz
答案 0 :(得分:0)
-copyToLocal
和-copyFromLocal
命令将其复制到本地FS并在那里工作。像-cat
这样的问题是Hadoop客户端代码中有很多东西被注销,因此管道很可能会带来太大的无关紧要,