监视和验证长距离distcp操作

时间:2018-10-17 16:02:24

标签: hadoop hdfs cluster-computing distcp

除了检查yarn / mapreduce日志以外,还有其他监视和验证大型hadoop distcp,群集到群集,hdfs复制作业的可能性吗? (数以百万计的大小文件,估计运行时间:几天,由于虚拟化环境和群集的并行生产使用而导致网络速度发生变化)

在HDP 2.6.1上使用DistCp V2和Apache Hadoop 2.7.3

1 个答案:

答案 0 :(得分:0)

使用distcp命令中的以下参数将复制状态写入日志:

-log <logdir>

将日志写入DistCp会将尝试复制的每个文件的日志保留为地图输出。如果映射失败,则重新执行该日志后将不会保留该日志输出。