[已解决]
我们在集群中有一些旧服务,需要对其进行更新以使用和处理两条额外的消息。消息以完全相同的方式构建,并以完全相同的方式使用。
服务运行了多个分区之后,我们开始看到随机的FabricNotReadableExceptions
。我们花了很长时间调查这个问题。
确定问题-
1:查看单个分区。
2:我们看到Node0
是主要的。
3:Node0
成为辅助站点,消息处理被取消。
4:Node1
成为主要用户,开始使用和处理消息。
5:由于某种原因,Node0
仍在同一分区上接收消息,并在尝试访问可靠状态时引发异常。
我们使用带有自定义分区的标准Service Fabric远程处理。到目前为止,它已经在多种服务上工作,从未出现过问题。
答案 0 :(得分:0)
我们解决的方法是将服务标记为ExclusiveProcess
。我仍然无法确切解释为什么要解决此问题,但是当多个分区在同一节点和服务类型下运行时,某些东西正在共享。
只是想提出这个问题,并让其他人知道一个可能的解决方案。