Hadoop是否保证来自同一文件的不同块将存储在群集中的不同计算机上?显然,复制的块将在不同的机器上。
答案 0 :(得分:1)
没有。如果查看HDFS Architecture Guide,您会看到(在图中)文件part-1
的复制因子为3,并且由标记为2,4和5的三个块组成。在一种情况下,块2和5如何在同一个Datanode上。
答案 1 :(得分:0)
答案 2 :(得分:0)
相反,我认为。抛开复制,每个datanode将每个数据块作为自己的文件存储在本地文件系统中。
答案 3 :(得分:0)
Hadoop并不能保证。由于这是一个巨大的安全性损失,如果您在作业中请求文件,则崩溃的datanode将导致整个作业失败。仅仅因为一个块不可用。无法想象你的问题的用例,也许你可以多说一点,了解你的意图是什么。