HDFS vs GridFS:何时使用哪个?

时间:2012-01-31 09:15:23

标签: mongodb hadoop hdfs gridfs

HDFS和GridFS是两种用于分布式文件保存的优秀技术,但它们的区别是什么?什么类型的问题更适合每个人?

4 个答案:

答案 0 :(得分:3)

用于批量处理的HDFS(你知道,当你运行一个逐个读取许多文件的查询时),但是当你进行随机访问操作时真的太糟糕了维护它甚至部署(你知道,所有这些Zookepers,Namenodes等)。另一方面,GridFS在批处理时速度较慢,但​​在进行大量随机访问时则不然,但与HDFS相比具有更大的存储开销。

我想说你应该使用HDFS for analitycs和GridFS来支持网站。

答案 1 :(得分:2)

如果您使用的是Hadoop,请使用HDFS,如果您使用的是MongoDB,请使用GridFS。对于仅存储随机文件来说,这两者都不是很好。它们是为分析平台而设计的。

答案 2 :(得分:1)

如果您只存储没有任何分析和map-reduce作业的文件,我建议您使用GridFS。它更容易定制和维护。我用于文件托管应用程序。在这种情况下,HFDS是矫枉过正的。

答案 3 :(得分:0)

GridFs与其他fs相比有点慢......首先考虑其他FS就像ceph ......

分布式文件系统 - 维基百科,免费的百科全书 - > http://en.wikipedia.org/wiki/Distributed_file_system

我认为HDFS真的是fs但GridfS只是数据库网格

最后使用基准但很难建议分布式文件系统