我在游戏中实施了Elo评级系统。玩家数量没有限制。玩家可以不断加入游戏,因此玩家数量可能会逐渐增加。
Elo值如何准确计算并不重要,因为这一事实:如果A队击败B队,那么A的Elo胜利等于B的Elo损失。
因此,我的评级系统的起始值存在问题:
我该怎么办?你能帮助我吗?提前谢谢!
答案 0 :(得分:57)
你可以从零开始,为显示的分数添加一个软糖因子,使其保持在零以上,或者你可以从1000开始 - 它们是相同的。是的,有了1000个起点,你将在系统中拥有越来越多的ELO积分,但每个玩家的平均数量总是相同的 - 1000.Elo的起始值始终是当前的平均值。 ELO是一场零和游戏,玩家A输掉的分数由玩家B获得。
当你将起点设置为1000时,你基本上说的是普通玩家= 1000分。有一组封闭的初始玩家(beta测试员?)这是真的,在该组平均值= 1000.但如果游戏是你随着时间的推移而改善的那么你的封闭组平均玩家变得高技能而不是没有播放。
现在,当您为新玩家分配1000时,您说新的普通玩家=现有的高技能普通玩家。事实并非如此,他们可能比你原来的封闭团队技能要低得多。所以新玩家会失分并且你的高技能玩家会获得=>通货膨胀。你需要做的是准确评估新玩家的技能,并为他们分配更符合他们实际技能的排名。这可以通过为他们的前x场比赛分配一个“临时排名”,直到你感受到他们的技能。暂时排名只有他们的ELO分数会改变,而不是他们所扮演的人。一旦他们加入真实系统,他们带入得分ELO的分数大致相当于他们的实际技能,他们不会显着上升或下降=>没有通货膨胀或通货紧缩。
简而言之:临时排名
答案 1 :(得分:18)
此网站使用了elo评级系统。他们从1200
开始取自http://gameknot.com/help-answer.pl?question=29
GameKnot评级系统基于Elo评级系统,固定K = 20,并进行以下修改:
前20场比赛用于在网站上建立球员的评分。在前20场比赛中,球员的评分被计算为他/她所有对手的平均评分,如果获胜则为+400,如果是亏本则为-400,平局为相同。与具有临时评级的玩家对战时使用+/- 200点。 在前20场比赛中,球员的评分是暂定的,之后就会成立。 在前5场比赛中,玩家的评分被认为等于1200.
只有在游戏中至少进行了3次移动时才会将超时计为胜利(无论进行多少移动,都会计算超时玩家的损失。)
在游戏开始时和结束时,两个等级中的较高者用于计算游戏结束后的等级调整。
例如,如果你在前20场评级的比赛中,你打了3场比赛而你赢了1200名具有临时评分的玩家,那么对阵1400名已经确定评级的玩家,但是对于已经确定评级的1600名玩家而言,你的评分将是: ((1200 + 200)+(1400 + 400)+(1600-400))/ 3 = 1467
或者,如果在你的前20场比赛中,你赢得1200比赛,赢得1400比赛,输掉1600比赛,比1500比赛,你的评分为: ((1200 + 200)+(1400 + 400)+(1600 - 200)+ 1500)/ 4 = 1525
答案 2 :(得分:4)
Elo在两个球员或球队的评分中处理差异,实际价值无关紧要。你可以从任何你喜欢的号码开始。我为Facebook拼字游戏联盟运行了一个起始值为5000的系统,只是为了区别于其他Scrabble评级系统。
通货膨胀不是由于评级过高的新人失去了经验丰富的玩家的积分 - 所有这些都是及时平衡的。离开系统的收视率低于平均水平的人的通货膨胀结果。这就是在线游戏中不同于真实国际象棋的情况,通货紧缩是一个问题,因为高评级的玩家退休并将他们的观点带出系统。
但是你需要担心通货膨胀吗?唯一重要的是,如果您希望将当前玩家的表现与历史数据进行比较 - 这不是任何在线游戏玩家可能面临的问题。即使你担心通货膨胀,也很容易纠正。找出所有当前玩家的平均评分,并将其与起始数字进行比较,如果它太高,请降低每个人的评分以使其恢复正常。根据我的经验,每个评级期间减少1或2个点就可以解决问题,并且会导致很多新人受到打击并且不会再回来。
许多系统为新手提供更高的K值,以便他们更快地找到他们的等级。
另一种方法是在他们玩第一个评级期之前不对新手进行评级,此时你根据Elo必须如何正确预测结果来计算评级。如果您将所有未评级的玩家聚集在一起并且(我认为)如果您在锦标赛中有多名新人参与递归,则这是不可能的。它还破坏了Elo的零和原则,并消除了衡量通货膨胀的能力。然而,与使用这个系统的人交谈时,我被告知“这一切都在实践中”。
我还要补充一点,我们有一个坚定的球员,他在过去四年中参加的732场比赛中输掉了21场比赛,而他的Elo仍然是4100左右。他每轮输掉的评分都快速接近零。
答案 3 :(得分:3)
我不知道它是否有用,但是Mark Glickman's Ratings Page讨论了Elo评级,它们的下降等问题(参见最后几段)。另请参阅他的评分系统Glicko system,它似乎考虑了播放频率并讨论了评级可靠性。最后,他的research page有很多论文讨论评级及其可靠性。
希望有所帮助。
答案 4 :(得分:2)
我会以一些积极的价值开始每个人(10,100,1000,没关系)。当两个相对能力的人互相比赛时,分数按预期交易。你需要集中注意力的是两个球员之间的某种相对能力。
假设,在游戏生命的后期,我有25000分,而你是100分的n00b。我击败了你,我什么都没得到,你什么也没有失去。为什么?因为我只是点了一个n00b,这就是原因。新玩家取下首发球员应该没有优势。此外,即使你处于某个角度范围内,你也应该实施一些只能在特定时间范围内从给定玩家那里获得如此多分数的东西。
显然,这将会在游戏的整个生命周期中不断调整。
答案 5 :(得分:2)
也许,让积分不能低于初学者,并把他的损失金额放在一些“口袋里。”
让我们说球员从0开始。 一名球员有elo 0并且输掉10分。他什么都不会失去,这些积分会落到一些口袋里。 现在让我们想象玩家赢得下一场比赛并得到11分。他没有得到11分,而只得到1分。而现在他的“口袋”将有0分。
答案 6 :(得分:1)
我认为互联网上大多数类似ELO的系统都会出现收视率下降的问题。
假设所有新玩家的评分均为零。 LousyPlayer失去了十几场比赛,他的评分远远低于零。是什么阻止他清理浏览器,在新的电子邮件地址下注册新帐户,然后重新开始?
如果可行,那么排名较低的账户将暂停,从而提高实际平均评级。