标签: hadoop hdfs flume flume-ng
我有一个大小合适的Hadoop集群,使用HDFSSink写入多个Flume代理(每台机器1个代理,不是集群的一部分)。几乎95%的时间,Sink批量完成率与源事件率一致,因此显示最小的信道大小利用率。这是理想的情况。
但偶尔,所有代理接收器开始遭受非常低的批量完成率,并且通道备份,我认为这是HDFS摄取率下降的结果。几小时后它会自动恢复。
关于如何调查/纠正这种情况的任何想法/指示?