应用错误收集

设定：

我们在Windows 2008 Enterprise Edition VM上使用AppFabric 1.1。

我们使用SQL服务器设置一个包含三个节点的集群，用于集群配置并使用卸载，因此SQL服务器应该通过确保使用New-AFCacheCluster -Offloading true创建集群来进行集群管理。然后，我们添加三个节点并启动集群。一切都很好。

然后我们使用-Secondaries 1选项设置一个缓存实例，称之为“Test”，HA。

测试场景：

然后，我们使用测试应用程序将一些测试数据放入缓存并访问该数据，一切都运行良好。然后，我们转到VM主机，然后在NIC中找到群集中的一个节点，以模拟该节点的故障。

结果：

一旦在一个节点上禁用了NIC，当我们从缓存中读取时，我们会得到超时而不是干净的故障转移。

如果我们在其他两个仍处于运行状态的主机上运行Get-AFCacheHostStatus，则在禁用NIC后第一次，此调用将需要很长时间才能返回主机的状态。一旦它最终返回状态，它会显示我们将NIC拉到UNKNOWN状态的节点。对Get-AFCacheHostStatus的后续调用将快速返回，但始终显示一个节点无法访问的错误消息，并将其显示为UNKNOWN状态。

好的，因此AF本身检测到该节点处于UNKNOWN状态，但测试应用程序此时仍然处于超时状态。几分钟后，在某个地方用了5-10分钟，应用程序最终会再次开始工作，只剩下我们剩下的两个节点。

Sooo，这里发生了什么？我们配置错误了吗？为什么集群需要这么长时间才能从这种基本类型的故障中恢复过来？

未检测到节点的AppFabric Cache Cluster及时失败

设定：

测试场景：

结果：

0 个答案: