我想根据他们的分数为我当地羽毛球俱乐部的每位球员制定最接近的比赛。所有比赛都是单打比赛。获胜者是第一个得到21分并有2个明确分数。如果第一个到第21个没有2个明确点,则游戏将继续,获胜者将是第一个有2个明确点或第一个到30点(以先到者为准)。因此,获胜者的得分可以在21到30之间,而失败者可以得到从0到29的得分。
我可以通过计算他们的平均得分差异来计算两个球员之间的相似性。平均值越低,球员越相似。
但是,我想对那些玩过更多游戏的玩家给予更大的权重。
添加公平加权的最佳方式是什么以及如何从任意数量的游戏中扩展?
TIA
答案 0 :(得分:1)
您可以从统计数据中应用confidence interval的概念。置信区间的大小(统计上)取决于样本大小(对应于所玩游戏的数量)和基础人口的方差。置信区间的长度随样本大小而减小(因为您有更多的估计数据),并且随着基础人口的方差增加而增加。
当然,您没有进行严格的统计分析,因此您可以自由地将置信区间的概念应用于适合您目的的公式中。正如您在链接文章中所看到的,当估计正常总体的平均值时,置信区间的大小随样本大小的平方根减小。因此,您可以通过"启发式"人为地在公式中使用该因子。理由。