寻找RabbitMQ的经验,特别是在使用Pacemaker和DRDB的HA配置中,如下所示:http://www.rabbitmq.com/pacemaker.html
DRBD部分特别让我感到紧张,所以我希望这里的人有真实的经验可以分享。
答案 0 :(得分:1)
大部分时间都在工作。但是,在处理DRBD时,你必须特别注意击剑(裂脑)。在生产系统上,必须手动修复此类问题总是很痛苦。
我们无法在主/从(多状态RA)中运行RabbitMQ。我们认为我们会提高可用性。我们现在回到一个实例。如果其他人有同时运行的几个RabbitMQ实例的经验并支持一个很好分享的主实体!
我发现,当存在问题时,缺乏调试Pacemaker的工具是部署到实时系统的一大障碍......并不总是清楚Pacemaker在“思考”或做什么。不幸的是,hb_report是不够的。
希望这有帮助,
d
答案 1 :(得分:0)
我们也尝试了主/从配置,但是很难将所有实例保持最新,没有停机时间。相信我,你想更新RabbitMQ。在RabbitMQ本身或Erlang中总会出现错误。
我们每年大约发生100次崩溃,日志中没有任何有意义的解释。启动"错误日志只有通用"错误在它,而且那就是它。有时它在崩溃后不会启动,大多数时候,唯一的解决方案是从所有实例中删除所有持久性消息,以便在整个群集中同步队列状态。其他时候它会在启动后立即崩溃,并且只有在多次重复尝试后才能正确加载。这意味着使用主/从时没有增加的可靠性。在我们的案例中至少没有。 (RabbitMQ 3.5.3,Erlang 18.0)
它适用于生产,但只有在日志或数据库中的某处保留了消息的副本,才能在发生重大崩溃后快速恢复。