容错软件架构

时间:2009-03-04 11:55:36

标签: architecture fault-tolerance

我正在寻找一些关于容错软件架构的好文章。我可以请一些建议。

5 个答案:

答案 0 :(得分:8)

我发现'Release It!'是一本很好的读物。

  

在Release It!中,Michael T. Nygard向您展示了如何设计和构建应用程序以应对其将面临的严酷现实。您将学习如何设计应用程序,以获得最大的正常运行时间,性能和投资回报。

答案 1 :(得分:7)

Handbook of Software Reliability Engineering你可以用pdf阅读它。软件可靠性的主要原则之一是容错。

看看chapter 14 Fault-Tolerant software

答案 2 :(得分:2)

链接转储! :)

这些是我在研究冗余的某个方面时得到一些想法(或仅用于术语检查)的一些在线事项。

ACM需要会员资格。

答案 3 :(得分:1)

由于有多种方法可以在软件中实现容错,因此在一篇文章中总结它是非常困难的。这些原则涉及桌面,服务器应用程序和/或SOA。还有多种方法,我们已经很少知道这些方法;例外的异常处理。尝试深入研究一篇文章中的所有概念将是一项艰巨的任务。你可以通过google上的简单搜索找到很多文章。

对于我的FYP,我研究了OS范围的自我修复系统。我遵循了Sun Solaris 10体系结构和IBM的自主计算研究(http://www.research.ibm.com/autonomic/)。

答案 4 :(得分:0)

关于Software Fault Handling techniques的这篇文章涵盖了以下主题:

  • 超时
  • 审核
  • 异常处理
  • 任务回滚
  • 增量重启
  • 投票