这个问题可能有点模糊,但我不确定如何使其更精确。
在使用群集分片扩展时,您必须提供某种持久性日志,以便插件可以存储其元数据(ShardRegionAllocated等)。
在跨节点实例化/移动新actor以从其冻结状态恢复时,将使用这些元数据。
假设由于任何原因您的日记被损坏(丢失一个条目,复制条目,无论如何)。这导致了actor的启动时出现了非常糟糕的异常(持久性恢复失败),如果处理不当,可能会终止整个区域。
管理此方案的最佳方法是什么? (我在堆栈的任何层面都要求提出想法,从主管的政策到直接在期刊上的某种干预)。 谢谢,
d
答案 0 :(得分:1)
使用Akka usergoup进行检查:将来可能会有更好的选择(仍在研究中),但是现在停止群集,删除元数据并重新启动它应该是安全的。
不幸的是,没有停机时间似乎没有办法做到这一点。