我正在使用区块链技术,我发现它将文件保存在多个不同的服务器上。现在,根据Hadoop文档,它还将文件存储在多个服务器上,并在1个主节点上保留1个主副本。 它还有动物园饲养员,它维护主节点和所有二级节点之间的数据。
现在我的问题是,是否有区块链的动物园管理员维护主副本或我的理解方式错误?
答案 0 :(得分:5)
这些是完全不同的动物。大多数区块链完整节点完全独立运行,并花时间验证交易。事实上,比特币协议或以太坊中的每个完整节点都拥有整个链的完整副本 - 也就是说,自块0以来所发生的每个事务。它们在共识的基础上运行和验证,因此它真正无头,而不是分布式集群。
HDFS在一个节点上(通常)被组织为“只是一堆磁盘”(JBOD),这意味着他们甚至通常不会对RAID感到烦恼。复制是跨节点完成的,但它不是完全复制,这意味着中型或大型集群中可能存在5个文件副本,并且磁盘故障可能会导致实际数据丢失(随集群大小增加)HDFS大规模扩展,但本质上存在风险,需要备份策略。另一方面,区块链更紧凑,但由于分类账有数千或数百万个完整副本,事实上每个副本都难以修改,因此几乎不可能丢失数据。
答案 1 :(得分:-2)
区块链基于IPFS,与HDFS不同。 IPFS是分散式文件系统,而HDFS是分布式文件系统。 在HDFS中,复制因子是常量,但在IPFS中,您感兴趣的同伴可以复制数据。
有趣的论文 - 其中描述了如何使用IPFS在HDFS之上增加hadoop作业的性能 链接 - https://www.cse.unsw.edu.au/~hpaik/thesis/showcases/16s2/scott_brisbane.pdf