标签: hadoop hdfs
我希望以二进制安全方式连接Hadoop上的几个大文件(比如说每个20-50GB的10个文件)。我可以写一个特定的加载器/存储来做到这一点但是想知道是否有一种标准的方法(例如Hadoop FS CLI)?我实际上甚至不关心内容顺序。
答案 0 :(得分:1)
" getmerge"是你在找什么 - > http://hadoop.apache.org/docs/r0.19.0/hdfs_shell.html#getmerge