我对HDFS的存储和可扩展性有一定的怀疑----
首先 即普通SQL Server数据文件上的1 TB也将大约为1 TB。在HDFS上等于1 TB。 那么使用HDFS有什么好处。
请澄清疑问(我不知道它是正确还是不正确)
其次
由于多个节点处理每个读/写操作,因此读取和写入的巨大性能增益来自并行性。
这个假设是否正确
请澄清疑惑
由于
答案 0 :(得分:0)
问题的措辞相当广泛,但我认为解决这个问题的最佳资源是Konstantin Shvachko关于HDFS scalability: the limits to growth的论文。