用于检测历史体育比赛数据趋势的程序化技术

时间:2011-12-26 09:12:55

标签: algorithm excel-vba data-mining vba excel

Summary

我一直在使用查看历史澳大利亚规则的结果,关注必发赔率,看看是否有机会更好地预测未来的比赛结果。我的进展至今已在下面的背景下详细介绍。

我现在想更进一步,看看我可能实现的数据挖掘/模式匹配/算法技术。我有使用动态模型(Extend)和在Excel中使用Solver进行优化的一些经验,但我不熟悉术语本身以外的数据挖掘

我是否可以使用可行的数据挖掘编程技术在VBA中进行此分析?

(我意识到这个问题可能会被某些人视为边界,但我认为Stack OverflowMath更适合这个问题 - 我很想了解潜在的编​​程选项/算法我可以在VBA中申请

我强烈倾向于使用VBA \ VBscript来看这个,因为这是我的编码背景,但如果它们明显更好,我会对其他选项持开放态度。

Background

我在过去几年里将澳大利亚规则足球的数据提取到Excel中。这些数据给了我:

  1. 逐季结果
    (例如WWWL意味着球队1在失去比赛前的前三个赛季领先,DLLL意味着第一和第二队在第一节结束时达到水平,然后第二队领先其余的比赛)。 / em>
  2. 相同的信息被重新分组为半结果
  3. 主队和客场球队(第1队是主队,2队客队)
  4. 比赛日体育场
  5. 一年中的某个月
  6. 然后我将其与其他数据集匹配,例如

    1. 按周划分的联赛(已完成)
    2. 体育场是露天还是关闭(已完成)
    3. 博彩公司赔率(比赛前)
    4. 露天体育场的天气情况(待办事项)
    5. 然后用PivotTables(可能是PowerPivot)骰子和拼接来查询这些数据以寻找游戏机会,例如:

      • 某些团队从头到尾(WWWW)比其他团队更频繁地领导,并且为“四季度”胜利(WWWW)付出的代价超过这个 可能性表明香草获胜(所以 Lay 赢得香草,返回 WWWW)
      • 寻找家庭和客场表演中的明显差异(即家庭地面知识,或党派家庭人群支持导致更多的¾次分数逆转)
      • 比较露天与封闭屋顶体育场的结果(消除天气影响)
      • 一周的长途旅行会影响下周的结果吗
      • 某些球队比标准联赛成绩更频繁地产生某些得分模式
      • 排名较低的球队在整场比赛中更有可能领先,而不是落后于击败排名更高的球队

1 个答案:

答案 0 :(得分:1)

这篇文章有点晚了,但只想在流程本身上加上我的2美分。

从我(相当广泛的)关于在这样的市场(包括Betfair)上运行预测算法的工作,我的结论是预测事件发生(返回)或不发生(存在)的可能性是没有用的。问题在于,即使您能够清楚地识别具有高准确度概率的趋势,由于市场赔率,您仍然无法从预测中获利。赔率有效地将概率倾斜回到50/50。 事实上,市场赔率本身会告诉你事件发生的隐含概率。

隐含概率%=(1 /(赔率 - 1))

例如:如果Back-Draw是4.1;它实际上意味着平局的可能性为32.25%。

要从Betfair有效获利,需要考虑市场差异的差异,而不是查看事件发生的概率。示例:由于赔率的快速市场变动,可能(短暂地)存在交叉市场赔率倾向于提供> 100%回报的情况。这不会发生在主要比赛上。主要是在较低量的比赛中。