我们的学生会将组织一场歌唱比赛,校园里的每个人都可以通过点击歌手在网站上的照片选择他/她最喜欢的歌手,然后选择学生的投票(点击照片) )将与10位音乐专业人士的投票相结合(每位评委只能为一位选手投票“喜欢”或“不喜欢”),最终选出今年最有价值歌手。
问:如果我知道每个参赛者点击(1 + - 40,000+)并现在判断得分(0 - 10),那么我可以选择哪种方式? (使用Python描述算法更好)任何想法都将不胜感激!
答案 0 :(得分:2)
首先将两个特征规范化为相同的比例,简单的方法是将其归一化为[0,1] interval 1 :
students_score = (throughput-1)/40000.0
judge_score = judge/10.0
现在您有两个标准化分数,您需要确定每个分数的重量,并使用线性组合进行评估:
final_score = a * students_score + b * judge_score
a,b
是您可以调整的参数,students_score ,judge_score
是上面计算的标准化结果
如果您愿意手动为参赛者的样本分数,您也可以使用 linear regression 选择最佳a,b
(1)有时候用max { throughputfor all }
这样的动态标准化更好,而不是硬绝对超限(在你的情况下为40000)