如何计算网络系统停机时间

时间:2015-10-08 17:20:32

标签: networking system downtime

这是两个系统,A和B.如何计算每个系统的停机时间。

对于A,应该是:0.01 * 10 * 6 * 12 = 7.2小时/年?

系统有10个物理节点,如果这些节点中的任何一个失败,整个系统就会关闭。单个节点的故障概率为每月1%,停机时间为6小时。那么每年整个系统的停机时间是多少。

B系统有10个物理节点,如果10个节点中有9个正在运行,整个系统可以正常运行。单个节点的故障概率为每月1%,停机时间为6小时。那么每年整个系统的停机时间是多少。

2 个答案:

答案 0 :(得分:4)

我们在谈论预期的停机时间,所以我们必须采取一种概率方法。

我们可以采用泊松方法解决这个问题。单个节点的预期故障率为每月1%,12个月内10个节点的故障率为120%(1.2)。所以你是正确的1.2失败/年* 6小时/失败= 7.2小时/年的预期值A.

通过使用7.2作为泊松分布的λ值,您可以计算出给定停机时间的可能性。

使用R:ppois(6,lambda = 7.2)= 0.42,意味着一年有42%的可能性停机时间少于6小时。

对于B,它也是一个泊松,但重要的是第二个节点在第一次失败后的六个小时内失败的概率。

失败率(假设30个月,120个6小时)是每个节点每6小时0.0083%。

因此,我们会考虑六小时内两次失败的可能性,即一年六小时的次数。

使用R:dpois(2.0,lambda =(0.01 / 120))* 365 * 4 = 0.000005069

0.000005069 * 3预计小时/故障= 54.75毫秒预计每年停机时间。 (每次故障预计3小时,因为第二次故障应该在第一次故障的中途平均发生。)

答案 1 :(得分:0)

1%失败率/月/节点在任何给定时间失败的概率为0,00138889%。我在Excel中使用二项分布来模拟当有8760 h / y * 10个节点= 87600"试验"时N节点失败的概率。我得到了这些结果:

0 failure:   29.62134067 %
1 failure:   36.03979837 %
2 failure:   21.92426490 %
3 failure:    8.89142792 %
4 failure:    2.70442094 %
5 failure:    0.65805485 %
6 failure:    0.13343314 %
...and so forth

N次故障将导致6N小时的停机时间(因为它们是独立的)。然后,对于每个6N小时的单节点停机时间,其他9个节点的失败的概率为(100% - 0,00138889%) ^ (9 * 6N)

因此,预期的双节点停机时间为P(1 node down) * (1 - P(no other node down)) * 6 hours / 2(除以2,因为平均第二次故障发生在正在修复的其他节点的中点)。当总结所有N次失败时,我预计双节点停机时间为9.8秒/年,现在想一想如何正确估计这个,但应该给出一个粗略的想法。相当蛮力的解决方案:/

Excel calculations