Akka集群分片:恢复期刊损坏

时间:2015-06-22 12:17:31

标签: akka akka-cluster akka-persistence

这个问题可能有点模糊,但我不确定如何使其更精确。

在使用群集分片扩展时,您必须提供某种持久性日志,以便插件可以存储其元数据(ShardRegionAllocated等)。

在跨节点实例化/移动新actor以从其冻结状态恢复时,将使用这些元数据。

假设由于任何原因您的日记被损坏(丢失一个条目,复制条目,无论如何)。这导致了actor的启动时出现了非常糟糕的异常(持久性恢复失败),如果处理不当,可能会终止整个区域。

管理此方案的最佳方法是什么? (我在堆栈的任何层面都要求提出想法,从主管的政策到直接在期刊上的某种干预)。 谢谢,

d

1 个答案:

答案 0 :(得分:1)

使用Akka usergoup进行检查:将来可能会有更好的选择(仍在研究中),但是现在停止群集,删除元数据并重新启动它应该是安全的。

不幸的是,没有停机时间似乎没有办法做到这一点。