我们正试图从数据中心迁移到Google Compute Engine。 虽然我们了解如何设置实例和部署工作负载,但我们不确定什么是存储数据的最佳等价物。 我们每天都会收到一次数据,并且在过去的1 - 2年内,每个服务器上都会有一些研究在收到的数据上运行。 有什么指针吗?
答案 0 :(得分:3)
听起来你正在寻找像NFS这样的共享文件服务器。您可以在单个GCE实例上运行NFS服务器,以将数据分发到各种计算节点。 Linux文档项目has a reasonable howto。
另一种选择是使用像Google Cloud Storage这样的对象存储,它允许您以各种名称存储二进制数据blob(有点像云文件系统)。如果您的软件需要使用标准文件系统命令来访问数据,则可以使用s3fuse之类的FUSE文件系统将Google Storage存储桶导出为每台计算机上的一组文件和目录。
如何在两个选项之间进行选择:
您可能也对此其他Stack Overflow问题感兴趣,该问题涵盖了一些相同的理由: Storage options for diskless servers
答案 1 :(得分:1)
只是为了响起并回应E. Anderson的回答,如果你已经在使用NFS并考虑使用s3fuse,你可能还想看看gcsfuse做类似的工作但是(我被告知)在GCS上有更好的表现(有关各种额外技术细节,请参阅gcsfuse-docs)。