我在三台虚拟机上安装了Service Fabric,在Windows Server 2016上每个虚拟机有5个节点(每个都配置了单独的NodeType以避免端口冲突等)。这类似于在开发环境中运行带有5个节点的OneBox Service Fabric机。
安装过程中一切正常,所有服务都正常启动。问题是ImageStoreService无法完成它的复制周期,其中3个节点之一(beta2
,gamma4
& beta0
位于In Build
而不是完成。
服务本身报告:
Error event: SourceId='System.FM', Property='State'.
Partition is below target replica or instance count.
ImageStoreService 3 3 00000000-0000-0000-0000-000000003000
N/P RD beta2 Up 131372506454740092
N/S IB gamma4 Up 131372506515241065
N/S RD beta0 Up 131372506515241066
(Showing 3 out of 3 replicas. Total available replicas: 2.)
我已确保每个系统服务创建的共享文件夹可用并且在磁盘上有一个备份文件夹(有时卸载过程会创建孤立)。我已在所有三台服务器上禁用了Windows防火墙以防止任何阻止。我在所有三台机器上重新安装了Windows Server 2016并重新安装了Service Fabric,问题仍然存在。
更新 根据对该问题的评论,我创建了一个新配置,并将其部署在3个虚拟机上(如前所述),但每个虚拟机仅运行1个节点。
服务再次启动正常,但ImageStoreService报告:
Unhealthy event: SourceId='System.FM', Property='State', HealthState='Warning', ConsiderWarningAsError=false.
Partition reconfiguration is taking longer than expected.
ImageStoreService 3 3 00000000-0000-0000-0000-000000003000
P/P RD gamma Up 131376836149092409
S/S IB alpha Up 131376836457801126
S/S IB beta Up 131376836457801127
(Showing 3 out of 3 replicas. Total available replicas: 1.)
随着时间的推移,此Warning
会变为Error
。似乎只要ImageStore的复制必须跨越VM,就无法完成复制。
我的问题是,是否有人之前遇到过此事?有关什么可能导致复制失败的任何建议?安装群集中的哪些位置存储了与复制事件相关的错误信息?
答案 0 :(得分:0)
一台机器应该是一个群集节点,而不是5.更多信息here。
独立Service Fabric群集中的每个节点都有该服务 已部署Fabric运行时,它是群集的成员。在一个典型的 生产部署,每个OS实例有一个节点(物理或 虚拟的)。