如何衡量给定人口属性的分布?

时间:2013-07-18 14:09:27

标签: statistics distribution normal-distribution

我有900个应用程序的目录。 我需要确定它们的可靠性如何作为一个整体进行分配。 (即这是正常的)。

我可以衡量单个应用程序的可靠性。

如何在不测量每个组的情况下确定整个组的可靠性?

1 个答案:

答案 0 :(得分:0)

这是一个非常开放的问题!总体而言,分布拟合可能非常具有挑战性,并且对于大样本(100或甚至1000)而言效果最佳。通常,最好根据您尝试建模的过程的已知特征来选择建模分布,而不是尝试纯粹的经验拟合。

如果您打算进行经验验证,首先您可以随机抽取样本,测量样本的可靠性分数(无论您使用的是什么),对样本进行排序,并将它们与正常分位数进行对比。如果它们沿着相对直线下降,则正态分布是合理的模型,您可以估计样本均值和方差以对其进行参数化。你可以应用与其他提议的分布中的绘图和分位数相同的想法,看看它们是否合理。

特别注意尾巴中的行为。根据定义,尾部很少发生,并且可能在样本中代表性不足。像所有统计数据一样,您可以绘制的样本量越大,结果就越好。

我还要补充一点,我之前认为正态分布不是很合适。您的可靠性分数可能落在有限范围内,往往更倾向于一侧或另一侧。如果它们倾向于高范围,我预测它们会在范围的末端被截断并且长尾到低端,反之亦然,如果它们倾向于低范围。