应用错误收集

时间：2015-06-22 12:17:31

标签： akka akka-cluster akka-persistence

这个问题可能有点模糊，但我不确定如何使其更精确。

在使用群集分片扩展时，您必须提供某种持久性日志，以便插件可以存储其元数据（ShardRegionAllocated等）。

在跨节点实例化/移动新actor以从其冻结状态恢复时，将使用这些元数据。

假设由于任何原因您的日记被损坏（丢失一个条目，复制条目，无论如何）。这导致了actor的启动时出现了非常糟糕的异常（持久性恢复失败），如果处理不当，可能会终止整个区域。

管理此方案的最佳方法是什么？（我在堆栈的任何层面都要求提出想法，从主管的政策到直接在期刊上的某种干预）。谢谢，

答案 0 :(得分：1)

使用Akka usergoup进行检查：将来可能会有更好的选择（仍在研究中），但是现在停止群集，删除元数据并重新启动它应该是安全的。

不幸的是，没有停机时间似乎没有办法做到这一点。