用于预测体育节目结束时间的最佳算法

时间:2015-09-28 09:09:42

标签: algorithm machine-learning statistics

例如,我知道比一个nba游戏安排在上午9:00到11:00,并且接近结束它将进入加班。我喜欢通过解析twitter预测来预测实际结束的时间。说我从Twitter收到的预测游戏结束时间的数据:

上午11:05, 上午11:07, 上午11:25, 上午10:45, 上午13:05, 上午11:15, 上午11:27, ...

哪种算法最能产生正确的答案?我能想到的只是对解析后的数据求平均值。我试图了解其他机器学习算法,但似乎它们太多了我想在这里实现的目标。如果不是,你能建议最好的算法吗?

2 个答案:

答案 0 :(得分:1)

您可以考虑添加一些方法:

  • 如果您有每个预测的时间戳,请使用加权平均值,对更近期的预测使用更大的权重,因为它们更可能是准确的。
  • 如果您假设为正态分布,则可以尝试删除异常值,即[-3 sigma,+ 3 sigma]之外的值
  • 如果每个预测都包含作者等元数据,则可以根据此作者之前预测的准确性对预测进行加权。

我希望这可以提供帮助

答案 1 :(得分:0)

我不确定机器学习算法会帮助您,如果您拥有的唯一数据是您从Twitter上的预测中解析的预测。您需要知道之前游戏的长度,并拥有一组关于过去游戏的属性。这样你的学习算法就可以从你已经知道其长度的游戏中学习。