我们有一个appengine应用程序,在HRD中有大约300GB的数据。我们每晚都进行了谷歌云存储的完整备份。然而,这已经变得昂贵,每天花费我们100美元。
我现在将此备份移动到每周一次。但由于数据是在HRD(高复制数据存储)中...是否真的需要备份数据?
我们无法承受超过一天的丢失数据。这就是为什么我们做每日备份。但这每天花费我们100美元。
关于HRD,iare备份真的需要吗?你有什么建议。
我也知道这是一个商业问题,但它也有技术方面的问题。
答案 0 :(得分:2)
存储在HRD中的数据会在不同区域进行复制,因此无需执行备份,除非您担心可以通过应用程序或开发者控制台修改/删除数据。
答案 1 :(得分:0)
备份到云存储的成本很高,但您始终可以使用remote_api和批量加载程序通过shell脚本下载数据,然后将它们存储在Dropbox,Google Drive或企业NFS上:https://developers.google.com/appengine/articles/remote_api。
假设您使用的是Python(如果您不是,请查看Java或Go对应的),您会:
appcfg.py create_bulkloader_config
appcfg.py download_data
命令。appcfg.py upload_data
答案 2 :(得分:0)
您可以尝试实施增量备份解决方案,该解决方案仅下载更新的数据,因为您的数据不太可能每天都在更改。
您需要一个像
这样的属性 updated = ndb.DateTimeProperty(auto_now=True, indexed=True)
在每个单一实体上。您甚至不必将新索引/属性应用于所有现有数据(因为1)您已经可能有备份而2)这将非常昂贵)
然后查询并备份自上次备份以来更改的所有实体。
答案 3 :(得分:0)