查询有关S3 +快照的EBS支持实例+备份

时间:2012-10-05 00:14:36

标签: amazon-s3 amazon-ec2 amazon-web-services

我花了几天时间研究在亚马逊上放置两个Windows服务器,一个域控制器和一个远程桌面服务服务器,但有一些我无法找到的问题或任何答案:

1)当你有一个EBS支持的实例时,我认为这意味着所有文件(OS / Applications / Pagefile)等都存储在EBS上?在数据中心的物理上,假设我有50 gig的OS文件/应用程序数据等,这些都存储在一个SAN类型的设备上吗?如果该设备爆炸或说特定数据中心被破坏会发生什么。其他地方的数据?整个EBS卷可能消失的概率是多少?

2)据我所知,你可以通过快照将你的EBS实例备份到S3。我假设你可以选择快照的频率(比如说每天?)。在我的上述场景中,如果我有50个文件,并且每天快照一次。超过7天我的S3存储将是350 gig还是50 gig +我一周内做出的增量变化?

3)我记得在某个地方读过实例必须离线才能进行快照。如果是这种情况,它会通过关闭来宾操作系统,快照然后启动来执行此操作,或者只是分离数据,阻止您在快照时连接,然后将其恢复到快照之前的确切时刻

4)我理解每月每个空间支付的概念,但我如何关注每100万个I / O请求0.11美元。当我运行Windows服务器时,它是如何工作的?我不知道服务器对其磁盘有多少I / O请求。我假设很多整个VM都存储在EBS卷上。在标准EBS上运行服务器会从根本上降低速度吗?

5)使用快照到S3作为主要备份的人是否正在为数据运行其他类型的备份?

对于noob问题感到抱歉 - 我很感激任何人可以提供给我的任何部分答案,答案或建议。提前致谢!

1 个答案:

答案 0 :(得分:1)

1)亚马逊对此很模糊。他们说数据在它所属的AZ中被复制,并且如果自上次快照以来你的数据变化少于20GB,你的年度失败率为~0.1-0.4%

2)手动触发快照,并以递增方式完成

3)取决于你的文件系统。例如,在具有xfs卷的Linux机器上,您可以将IO冻结到卷,执行快照(只需要一秒左右),然后解冻。如果拍摄快照时没有做类似的事情,则存在数据处于不一致状态的风险。这取决于您的文件系统

4)我在EBS上运行我的所有实例。您可能不希望在EBS上使用页面文件,因此使用实例存储会更有意义。您使用的IO数量将非常依赖于工作负载。 IO计数在很大程度上取决于您的工作负载 - 例如,应用程序服务器的IOP比数据库服务器少得多。如果您正在运行特别重要的IO操作,那么每个卷每月可能不会花费超过几美元

5)我个人并不关心已安装的软件/配置(我有AMI的所有设置,所以我可以在几分钟内恢复),我只关心数据。我单独备份数据(S3& Glacier)。部分原因是因为我被EBS大约一年前左右的一个错误所困,他们失去了一些快照

你也使用多种策略,正如Fantius评论的那样。例如,在我运行的mongodb服务器上,启动卷很小(并且从不快照或备份,因为它可以从AMI自动恢复),其中包含实际mongodb数据的单独数据卷。 mongodb卷被快照以及在S3上存储转储。快照是创建备份的有效方式(因为您只存储增量更改),但是您无法将它们传输到EC2区域,而S3上的tarball可以轻松地复制到任何地方。