AppFabric Cache似乎不稳定

时间:2011-01-20 11:32:59

标签: caching appfabric

我们正在尝试使用AppFabric分布式缓存。经过大量的非域服务器来回,我们最终将它们放在域中,安装/设置更容易一些。我们在经历了大量错误之后开始运行,其中大部分错误在AppFabric中包含一些测试或更具描述性的错误消息似乎微不足道。 “临时错误”并没有解释很多......

但仍有问题。

我们设置了3台服务器,其中一台是“领先”。我们终于让缓存工作了,我们通过将网络负载均衡器一次指向一台服务器来确认我们可以在一台服务器上设置缓存并在另一台服务器上检索缓存来确认这一点。

然后我在所有服务器上重新启动了AppFabric缓存服务,突然它无法运行。 Get-CacheHost说它们已经启动,但我们得到了例外情况:

ErrorCode<ERRCA0018>:SubStatus<ES0001>:The request timed out
ErrorCode<ERRCA0017>:SubStatus<ES0001>:There is a temporary failure. Please retry later.

为什么只需重新启动服务就会出现此错误情况?
AppFabric Cache真的可以用于生产吗?
如果服务器脱机会发生什么?超时超时?
我们依赖“领先”服务器吗?

我怀疑它会在R&amp; R 5-10分钟后恢复。它似乎有时会自行回归。

更新:几分钟后确实出现了。我们现在已经通过从群集中删除一个服务器进行了测试,结果是长时间超时并最终导致异常。

1 个答案:

答案 0 :(得分:7)

我们已经调试了一段时间,我正在分享我们迄今为止所发现的内容。

  • Windows 2008上的UAC实际上阻止了对本地计算机的访问,因此对本地计算机的命令将失败。以管理员身份启动PowerShell或完全关闭UAC以绕过。
  • 手动更改配置文件无效。您需要使用导出和导入命令。
  • 防火墙是一个主要问题,因为安装程序会打开222 *端口,但PowerShell工具会使用其他Windows服务。关闭所有服务器上的防火墙(不推荐)解决了这个问题。
  • 如果从群集中删除服务器,则群集可以再次运行之前会有初始超时。
  • 重新启动后,群集使用2-5分钟重新启动。
  • 如果重新启动且无法访问一台服务器,则启动时间会增加。
  • 如果无法访问保存配置共享文件共享的服务器,则服务将无法启动。我们试图通过为每个服务器提供私有共享来解决这个问题。