机器学习算法混淆

时间:2014-05-06 15:06:03

标签: machine-learning svm bayesian logistic-regression

我使用机器学习做了一个关于板球预测的小应用程序。 我记录了10年(2001-2011)ODI比赛的记录,并准备了训练集。

现在预测特定团队的输赢,我考虑了各种因素。

例如,这是印度Wankhede体育场的印度与澳大利亚比赛。

  1. 印度过去10年的记录。

  2. 印度过去两年的记录。 (最近的表格)

  3. 印度过去10年在印度的记录。

  4. 印度过去两年在印度的记录。 (最近的表格)

  5. 印度在Wankhede的记录,过去10年。

  6. 印度在Wankhede的记录,过去2年。 (最近的表格)

  7. 澳大利亚过去10年的记录。

  8. 澳大利亚过去两年的记录。

  9. 澳大利亚过去十年对印度的记录。

  10. 澳大利亚过去两年对印度的记录。

  11. 澳大利亚近10年来在印度对印度的记录。

  12. 澳大利亚过去2年在印度对印度的记录。

  13. 所以我们采取了所有的概率, 例如,印度在10年中打了322场比赛并赢得了140场比赛,因此获胜概率为140/322,等等所有其他因素。 现在我们最终添加了所有概率,并获得了两个国家的赢利损失百分比。 我想知道它是什么样的定理。 它起初是NaïveBayes,但在NaïveBayes中,我们将概率乘以,与此不同。 你可以在这里查看实施, http://www.manzarict.org/cricket 我们使用基本的PHP,以便我们可以使用SQL查询更快地找到概率。 现在这可能是一个错误的方法来实现这个总和,欢迎替代方法。

2 个答案:

答案 0 :(得分:1)

接近板球比赛获胜球队预测很有趣。它不仅限于一项运动,而且在各种运动中,您都可以构建ML模型来预测比赛结果,甚至可以开始比赛。

这是我对ICC世界杯板球2019预测的研究。我们使用了-Logistic回归模型。但是,在这种情况下,我们已经略微超过了2001年,并基于1987年的数据构建了一个模型。

Github链接:https://github.com/RutvijBhutaiya/Cricket-World-Cup-2019

答案 1 :(得分:0)

这是一个简单的线性模型,你甚至不适合模型的权重,而是使用常数值。线性模型使用

进行缺陷
cl(x) = sgn(<w,x>+b) = sgn( SUM w_i x_i + b )

其中x是您的数据点(x_i是ith功能)。在你的情况下,所有w_i = 1(你只需添加所有功能,全部)。打电话给这个&#34;定理&#34;会是太多,它只是一个先验假设(因为你不训练它)琐碎(因为它由常数值,没有专业知识组成)线性模型(因为它使用加权的特征总和)。