应用错误收集

这是一个非常开放的问题！总体而言，分布拟合可能非常具有挑战性，并且对于大样本（100或甚至1000）而言效果最佳。通常，最好根据您尝试建模的过程的已知特征来选择建模分布，而不是尝试纯粹的经验拟合。

如果您打算进行经验验证，首先您可以随机抽取样本，测量样本的可靠性分数（无论您使用的是什么），对样本进行排序，并将它们与正常分位数进行对比。如果它们沿着相对直线下降，则正态分布是合理的模型，您可以估计样本均值和方差以对其进行参数化。你可以应用与其他提议的分布中的绘图和分位数相同的想法，看看它们是否合理。

特别注意尾巴中的行为。根据定义，尾部很少发生，并且可能在样本中代表性不足。像所有统计数据一样，您可以绘制的样本量越大，结果就越好。

我还要补充一点，我之前认为正态分布不是很合适。您的可靠性分数可能落在有限范围内，往往更倾向于一侧或另一侧。如果它们倾向于高范围，我预测它们会在范围的末端被截断并且长尾到低端，反之亦然，如果它们倾向于低范围。

如何衡量给定人口属性的分布？

1 个答案: