我安装了一个具有15个数据节点的HDFS集群。有时,整个hdfs群集的写入性能很慢。
我如何找到最慢的数据节点,哪个节点会导致此问题。
答案 0 :(得分:0)
数据节点运行缓慢的最常见原因是磁盘损坏。磁盘超时错误(EIO)的默认范围是30到90秒,因此该磁盘上的任何活动都将花费很长时间。
您可以通过在hdfs-site.xmls中查看每个数据节点的dfs.datanode.data.dir
并验证所提到的每个目录是否确实有效来进行检查。
例如:
ls
cd
进入目录如果这些活动中的任何一项不起作用或花费很长时间,那就是您的问题。
您还可以在每个主机上运行dmesg
并查找磁盘错误。
其他信息