标签: streaming hdfs distributed glusterfs ceph
我正在编写一个抽象层,它将抽象一个(尚未决定的)分布式文件系统的后端实现。
要使用的文件系统的可能选择是HDFS,GlusterFS,CEPH ....
前端将是SOAP / REST服务。
要实现的抽象层将从Web服务接收数据流并将其发送到后端分发文件系统。
文件大小为多GB。
我的问题
将数据推送到分布式文件系统的最佳方法是什么 - 如果我们需要最大吞吐量,不丢失数据,并利用后端文件系统的分布式特性