HP NonStop系统(以前称为“Tandem”)以其高可用性和可靠性以及更高的价格而闻名。
在这些方面和其他方面,基于Linux或Unix的群集如何与它们进行比较?
答案 0 :(得分:14)
在容错机器上,容错直接在硬件中处理,对应用程序透明。对集群进行编程需要您明确地处理应用程序中的容错。
实际上,与为容错平台(如NonStop)构建的应用程序相比,集群应用程序体系结构的构建和错误要复杂得多。这意味着应用程序错误驱动的不可靠性的范围要大得多,如伦敦证券交易所found out the hard way.他们有一个现有的基于Tandem的系统,这是一个非常常见的证券交易所交易应用程序架构。他们的新首席执行官有一个明智的想法,即微软是前进之路,并有一个大型咨询公司建立一个基于120台服务器集群的.Net系统。
群集应用程序的问题是故障可能是相关的。如果系统中存在应用程序或配置错误,则通常会在所有节点上复制它。这意味着您可以获得可以取出整个群集的单个情境或事件。集群应用程序的额外复杂性使得它们更容易出错并进行开发和部署,这增加了发生这种情况的可能性。基于(例如)Linux和J2EE构建的集群系统容易受到相同类型的故障模式的影响。
恕我直言,这是旧式大型机架构的一大优势。一些供应商(IBM,HP,DEC以及可能还有其他几个我无法想到的供应商)制造了容错系统。此类系统的基础编程模型比集群的n层应用程序服务器稍微简单一些。这意味着相对较少出错,并且通过一定的努力,您可以实现更可靠的系统。令人惊讶的旧架构数量仍然存在,而且在市场中生活相当舒适。 IBM仍然销售大量的Z和I系列机器; Unisys仍然生产A系列和2200系列; VMS和NonStop在HP内部仍然存在。这些系统的销售并非全部都存在于现有客户身上 - 例如商业承保系统(GENIUS)在ISeries上运行,并且仍然是这个市场的市场领导者,在我写这篇文章时正在进行新的推广。该应用程序经历了两次重写它的尝试(在Java中为1,在.Net中为1),我知道并且'Old School'平台似乎并没有真正地扼杀它的风格。
我不会短缺任何屏幕刮刀供应商......
格雷& Reuter的Transaction Processing: Concepts and Techniques有点干燥和学术性,但对容错系统架构有很好的处理。其中一位作者是Tandem系统设计的关键人物。