如何在集群之间使用hadoop distcp复制特定数据(列)?

时间:2019-07-11 19:31:01

标签: hadoop parquet distcp

在Cloudera环境中,我需要将数据从一个群集复制到另一个群集并删除所有PCI列,是否可以使用单个hdfs distcp命令(如sqoop)中的选项?还是可以做得到?

源格式是混合的,有些是实木复合地板,有些是文本。目标位置,请使用原始格式。

非常感谢您。

0 个答案:

没有答案