我为主Sql Azure数据库设置了Active Geo-Replication。 如何通知我的主数据库因数据中心问题而不可用,以便我可以开始应用程序故障转移程序?此外,Traffic Manager如何通知故障转移事件?
答案 0 :(得分:1)
对于大多数大规模的中断,您的应用程序连接将受到影响,因此可能会显示为某种类型的应用程序警报。所以你真正的问题是你需要检查什么,以确保这是一个真正的灾难,并保证故障转移。该问题的答案取决于您的故障转移过程的设置方式。如果涉及人类步骤,例如有人必须批准故障转移,因为它的影响,您可能想要检查门户中的警报。如果除了事件警报之外,它是区域范围内的重大事件,您将看到您的逻辑服务器被标记为已降级。
如果您想设置完全自动化的过程,在收到应用程序警报后,您可能需要检查复制连接状态。您可以通过在目标主服务器上查询sys.dm_database_copies
DMV或在目标数据库上查询sys.dm_continuous_copy_status
来实现此目的。两者都公开is_interlink_connected
,它将告诉您复制链接是否不健康。请注意,它监视整个复制通道的运行状况,而不仅仅是您的特定复制链接。如果应用程序收到来自主要文件和is_interlink_connected=0
的重复超时,则表明可能会发生中断。但它不是100%的保证,并且仍然可能存在误报。您的应用程序目标RTO应该可以帮助您确定在强制进行故障转移之前可以等待多长时间(作为消除误报的方法)。
关于最后一个问题,有一些信息是监测方法here 我不确定是否有实际警报。您可能需要在个人资料中轮询终点状态。