HP / Tandem NonStop如何在没有备件的情况下实现单故障FT?

时间:2018-02-01 02:26:55

标签: fault-tolerance hp-nonstop tandem

据我可以从维基百科和令人难以置信的HPE网站收集,NonStop系统架构声名鹊起,它可以实现单故障FT,而无需分配过多的备用容量(即在锁步架构中)你通常需要3倍的过度配置。

这似乎是一个理想的属性,但我找不到有关他们使用的方法和警告的更多细节。即他们对网络做出的假设是什么,他们容忍的失败类型,假设的客户行为,可接受的恢复时间,他们运行的工作流程等等。

有没有人能够简要描述一下NonStop系统如何解决故障检测和故障纠正的典型问题?它是系统级的通用神奇解决方案,还是要求编写应用程序以使用某些事务工具和检查点数据和通信?

非常感谢!

3 个答案:

答案 0 :(得分:6)

惠普的这篇论文概念性地涵盖了您的问题:

http://www.hpl.hp.com/techreports/tandem/TR-86.2.pdf

答案 1 :(得分:0)

我认为它类似于IBM架构,没有共享任何结构。大量冗余,但没有任何共享或配置/专用 - 基于我之前在IBM z / OS和大型机上的阅读。

通常,此类系统使用专有操作系统和修改后的内核以及特殊的FS /驱动程序来利用底层硬件。在某些情况下,需要修改yes应用程序以利用某些特殊的事务库,但就像在水平扩展时需要为RDBMS设置事务锁一样。

许多此HA / FT可以在内核级别实现,远离应用程序。

注意HPE Non-Stop系统中的芯片,它是Itanium架构,而不是常规的Xeon芯片。就像IBM拥有自己的专有企业级CPU一段时间https://en.wikipedia.org/wiki/Z/Architecture

答案 2 :(得分:0)

T / 16 CPU绝对不是IBM体系结构,而是专有设计。 HP 3000小型机对它的影响很大。最初的Tandem团队主要来自HP和Burroughs。

Wiki在较高级别上陈述了大多数内容:https://en.wikipedia.org/wiki/Tandem_Computers