Cloudera可安装HDFS是否提供重复数据删除

时间:2011-06-10 02:27:40

标签: hadoop storage fuse hdfs cloudera

着眼于运行基于HDFS的存储集群,并查看通过Cloudera版本使用可安装HDFS系统的简单方法。

我问的第一个问题是,它会提供数据的自动重复数据删除吗?

我问第二个问题,如果所有用户删除包含特定重复数据删除块的文件,是否会执行重复数据删除,那么实际上是从存储中删除该块还是只删除该用户的索引/引用?

最后,此方法是否包含Rainstor压缩方法?

感谢您的输入

1 个答案:

答案 0 :(得分:1)

不,HDFS不包括重复数据删除。

该体系结构主要侧重于最佳地使用顺序写入/读取模式,因此它几乎与重复数据删除相反,因为我所知道的每种重复数据删除方法都会引入一定量的随机IO模式。