有时,数据块以不平衡的方式存储在数据节点上。基于HDFS块放置策略,第一副本有利于存储在写入节点(即客户端节点)上,然后第二副本存储在远程机架上,第三副本存储在本地机架上。在此放置策略下,使数据块在数据节点上不平衡的用例有哪些?一个可能的原因是,如果写入节点很少,那么数据块的一个副本将存储在这些节点上。还有其他原因吗?
答案 0 :(得分:4)
以下是数据偏差的一些潜在原因:
“hdfs balancer”命令允许管理员重新平衡群集。此外,https://issues.apache.org/jira/browse/HDFS-1804添加了一个新的块存储策略,该策略考虑了卷上剩余的可用空间。