跟踪相对趋势的算法

时间:2017-10-06 08:01:01

标签: algorithm statistics trend

我正在使用文章标记(他们的关系是 n:m )的网站上工作。该网站的一个重要部分是按标签过滤文章。标签具有某些权重,表示它们的相对重要性。权重会随着时间的推移而变化(每天),具体取决于它们用于过滤文章的频率(点击)。)

我应该使用什么算法来计算权重?关键标准:

  • 根据历史数据(点击数),但很短期(〜最后10-20 天)
  • 过去数据的相关性随着时间的推移而下降(来自 昨天比10天前的点击更重要)
  • 尊重个人趋势"标签(从100开始的标签) 一天内达到200次点击,胜过两天内有200次点击的标签 行)
  • 尊重新标签(没有历史点击)
  • 尊重在过去几天内没有获得多次点击的标签(高权重的标签自然会获得更多的点击次数,因此#34;较弱的标签应该仍然会被拍到#34;打破圈子"每隔一段时间)

1 个答案:

答案 0 :(得分:0)

我建议使用以下标签重量公式:

Score = c1 * Hits(today) + c2 * (Hits(today) - Hits(yesterday)) + c3 * Random
Weight = a * Score + (1 - a) * Weight(yesterday)

其中

  • 随机 - 随机值0..1
  • c1,c2,c3,a - 适当的常数值,0<a<1