标签: hadoop hive hdfs parquet hadoop2
我有一个巨大的数据库,我正在尝试使用 distcp 将其复制到其他集群。但是,由于带宽有限,我想使用 bzip 压缩这些文件(它已经处于快速压缩状态。在快速压缩之上。
有没有办法可以在 hdfs 上做到这一点。而不是将文件移动到本地文件系统然后应用压缩。