未检测到节点的AppFabric Cache Cluster及时失败

时间:2013-08-02 22:11:22

标签: caching appfabric

设定:

我们在Windows 2008 Enterprise Edition VM上使用AppFabric 1.1。

我们使用SQL服务器设置一个包含三个节点的集群,用于集群配置并使用卸载,因此SQL服务器应该通过确保使用New-AFCacheCluster -Offloading true创建集群来进行集群管理。然后,我们添加三个节点并启动集群。一切都很好。

然后我们使用-Secondaries 1选项设置一个缓存实例,称之为“Test”,HA。

测试场景:

然后,我们使用测试应用程序将一些测试数据放入缓存并访问该数据,一切都运行良好。然后,我们转到VM主机,然后在NIC中找到群集中的一个节点,以模拟该节点的故障。

结果:

一旦在一个节点上禁用了NIC,当我们从缓存中读取时,我们会得到超时而不是干净的故障转移。

如果我们在其他两个仍处于运行状态的主机上运行Get-AFCacheHostStatus,则在禁用NIC后第一次,此调用将需要很长时间才能返回主机的状态。一旦它最终返回状态,它会显示我们将NIC拉到UNKNOWN状态的节点。对Get-AFCacheHostStatus的后续调用将快速返回,但始终显示一个节点无法访问的错误消息,并将其显示为UNKNOWN状态。

好的,因此AF本身检测到该节点处于UNKNOWN状态,但测试应用程序此时仍然处于超时状态。几分钟后,在某个地方用了5-10分钟,应用程序最终会再次开始工作,只剩下我们剩下的两个节点。


Sooo,这里发生了什么?我们配置错误了吗?为什么集群需要这么长时间才能从这种基本类型的故障中恢复过来?

0 个答案:

没有答案