我在多语言词典网站上工作,这本词典中的每个单词都会与许多人类发音相关联,作为可由用户录制的音频文件。每个单词可以不时链接到10个音频文件(例如,每个单词3个月后),系统将使用评级系统删除不良发音音频片段,在这种情况下(-5,-2) ,0,+ 2,+ 5)。
但问题在于:
如果一个词链接到:
(1)旧的音频文件(平均质量),10 + 2票,2 + 5票(评级没有文件编号快9)
(8)旧的音频文件(平均质量),10 + 2票,1 + 5票(其评级没有第9号文件增长速度快)
这意味着,9号文件是很好的发音文件,因为它的评级增长很快,但其得分不是很高。如何在评级系统中使用时间增长因子?
答案 0 :(得分:0)
考虑到投票时间与现在计算分数之间的经过时间,Yoy可以包括投票的记忆因素。
当你进行平均时,例如使用这些n = 4的数字是相同的:
1 + 2 + 3 + 4 = 10
10 / 4 = 2.5
而不是添加个人贡献:
1/4 + 2/4 + 3/4 + 4/4 = 2.5
因此,使用最后一种计算方法,您可以将每个贡献乘以一个随时间从1减小到0的内存因子,使得较旧的值在加到平均值时会减轻。
例如,可能的因素可能是使用x /大于1的1 / x函数。
f(time_gone_by) = 1/(1 + time_gone_by)
(time is in days)
对于7天前的投票,它将评估为:
vote_value/number_of_votes * 1/8.
如果今天投票,这将是其价值的12%。
也许这个功能并不是你所需要的,但你可以用不同的功能取代因子计算,以更好地适应你的需要。