篮球统计预测算法

时间:2013-04-22 21:36:31

标签: machine-learning data-mining pattern-recognition

我正在开展一个项目,我需要根据过去的篮球运动员统计数据来预测未来的数据。我希望能够根据过去三个赛季的统计数据预测下赛季的统计数据(如果有前三个赛季可供选择)。有没有人建议我可以使用一个好的预测算法?数据是连续的,可以有5-14个维度(年龄,分钟,点等)

谢谢!

注意:我真的很想使用Weka程序来做这件事。

3 个答案:

答案 0 :(得分:2)

开箱即用,random forest可能会给你一个强大的基线,所以我会从这开始。

您也可以尝试尝试linear regression,这是一种简单但相对有效的方法,但根据数据可能需要更多调整(例如转换一些输入和/或输出变量)。 / p>

Gradient boosting回归是另一个强有力的预测因子,但通常还需要进行更多调整才能正常运作。

所有这些算法都有Weka实现。

答案 1 :(得分:0)

我建议您使用Lazy KStar算法。

取自Pentaho wiki:“ K * 是一个基于实例的分类器,即测试实例的类基于与之类似的训练实例的类,由一些相似性函数确定。它与其他基于实例的学习者的不同之处在于它使用基于熵的距离函数。“

答案 2 :(得分:0)

显然没有一个正确的答案,但对于任何想要做类似事情的人,我会更好地描述我的问题以及我找到的解决方案。我创建了一个csv文件,其中每行是不同的季节,每列包含不同的属性。对于我想要预测的每个属性,我有当前赛季的统计数据,然后是上一赛季统计数据的另一个列。所有“上一季”专栏中的第一个(新秀)赛季将为0。使用此数据集,我将其加载到Weka中并使用Multilayer Perceptron,并将test-option设置为Cross-Validation。我将折叠次数设置为可用季节数的80-90%之间。

最后,要预测下一季的统计数据,最后再添加一行,并用“?”输入最后一季的值。在您要预测的列中。如果有人想要更深刻的例子,我很乐意提供一个。