我正在运行hadoop,并且在群集中有两个配置相同的服务器。他们运行相同的任务,相同的配置,相同的一切,并且两者都完全专注于hadoop任务节点(工人)。
我正在通过此群集运行的作业是高度IO绑定的。
在一台服务器上,我看到60-100MB/sec
的{{1}}和IO
的{{1}},在另一台服务器上,我看到CPU load
5-10
和一个40-60MB/sec
(即使运行一个简单的shell,该框几乎无法使用)。
我已经运行IO
并且没有收到任何磁盘警告。
关于我接下来可能做什么的任何建议,以确定这些盒子之间的根本区别?这些结果在数小时的处理过程中保持一致。
答案 0 :(得分:0)
在4096字节的物理/ 512字节逻辑磁盘扇区上有分区错位的气味。