我面临的挑战是业务用户希望将“贝尔曲线”应用于他们的评分。
该系统以1-5分的比例对人进行评分。要求是大多数人得分过于慷慨,他们希望根据钟形曲线调整一组人的分数(或者上调)。
我认为他们试图让大多数人坐在中间水平,即在这种情况下为3。我不确定客户在Bell Curve中的术语是否正确,但要求是将分数调平到3级。
实现这一目标的最佳算法是什么?
例如,在一个组中,他们可能有3,4,4,3,5组分数。在这种情况下,得分平均高于3.什么是调整所有这些得分的公平方式,以便应用“钟形曲线”?
答案 0 :(得分:2)
钟形曲线是正态分布的概率分布函数(PDF),因此这是你的目标。
此转换的关键是累积分布函数(CDF)。用语言来说,“y%的值小于或等于x”。您可以轻松地在输入中列出您拥有的CDF。正态分布的CDF也是已知的(钟形曲线的积分)。
总之,这给你:“y%的分数小于x,但根据正态分布,y%的分数应小于x',因此校正为x - > x'”
数学上,这是通过probit function完成的。
答案 1 :(得分:0)
您通常假设您的数据适合分布而不是将数据转换为给定的分布。
如果输入数据符合正态分布(“钟形曲线”),则只需在所有样本中添加/删除相同的值即可进行调整。
分发将被保留,只有平均值会改变。
如果您希望将分布集中在给定均值上,只需添加目标均值与实际均值之间的差异。