计算法国轮盘赌估算时出现无法解释的百分比误差

时间:2016-11-27 20:57:05

标签: r probability percentage

我正在开设一个课堂项目:这是关于四种不同法国轮盘(37号)策略的统计评估。 前两个非常简单:

  • 甲。投注红色一次
  • B中。投注第一名

请找到以下代码:

BettingOnRed <- function(){
  ball <- sample(1:37, 1, replace=TRUE)  
  if(ball <= 18)  amount_won <- 1
  else            amount_won <- -1
  c(amount_won, 1)
}

BettingOnNumber <- function() {
  myNumber <- 17
  ball <- sample(0:36, 1, replace=TRUE)
  if(myNumber == ball)  amount_won <- 35
  else                  amount_won <- -1
  c(amount_won, 1)
}

每个函数返回一个length = 2向量,其中包含赢得的金额和投注数量(在这两个函数中总是等于1:此值在其他策略中起作用...)。

即使它们看起来很简单,如果我们计算预期奖金的百分比误差和每场比赛的胜利比例,我们部分会得到巨大的错误。请参阅下表:

Click to see the table

为了计算预期值,我设置了一个函数simulation(),它会重复每个游戏100,000次并计算你在表格中找到的值。

我不明白的是:为什么每场比赛B的奖金百分比误差如此之大,而B赢得的比赛的百分比误差是如此之小?

请在此处找到我们用于计算游戏B的确切值和百分比误差的公式:

  • EstWin为每场比赛B的奖金估算。
  • EstProp估算B赢得的比赛。

各自的确切值为:

  • ExactWin = 1/37 * 35 - 36/37 = -1/37
  • ExactProp = 1/37

百分比错误:

  • PercErrorWin =(EstWin - ExactWin)/ ExactWin
  • PercErrorProp =(EstProp - ExactProp)/ ExactProp

您如何解释此错误?为什么B的错误不一样?我在这里错过了一个关于概率的重要事实吗?

在下面找到我的函数'simulation'的负责部分: (作为第一个参数,它需要上面两个函数中的一个)

simulation <- function(f, n = 100000){
  result <- numeric(8)
  winnings <- numeric(n)
  games_won <- numeric(n)
  for (i in 1:n){
    fnct <- f()
    winnings[i]  <- fnct[1]
    games_won[i] <- ifelse(fnct[1] > 0, 1, 0)
  }
  result[1] <- mean(winnings)
  result[2] <- mean(games_won)
  result
}

请注意,这不是整个功能,我只是删除了此问题的不必要部分。

1 个答案:

答案 0 :(得分:1)

tl; dr 您的结果似乎是正确的;比您想象的更多变化(数字下注的变化很多大于下注红色的变化......)

您的模拟有很多方面可以简化,但我认为您的基本框架是正确的。真的,你唯一缺少的是输出中预期的变化量;如果你仔细观察,你会发现观察到的与预期之间的偏差确实不足为奇。 (你实际上可以通过分析来计算这种方差,但在这里我会用蛮力来做。)

模拟100次运行,每次运行100,000次。我方便地使用plyr::raply()(它会自动汇总您的结果并实现进度条),但您也可以使用replicate()for循环执行此操作

set.seed(101)
library(plyr)
rr <- raply(100,simulation(BettingOnNumber,100000),.progress="text")

绘制平均奖金的分布:蓝色=预期,红色=从单次模拟中观察到。

par(las=1,bty="l")
hist(rr[,1],col="gray",breaks=30,
     xlab="mean amount won in 100,000 games",
     ylab="Frequency (100 runs)")
exp_val <- -0.02703
obs_val <- -0.04852
abline(v=c(obs_val,exp_val),col=c("red","blue"),lwd=2)

enter image description here

这里计算出这种程度的偏差是多么令人惊讶:

mean(abs(rr[,1]-exp_val)>abs(obs_val-exp_val)) ## 0.21

这意味着您可以在21%的时间内获得您所看到的预期和观察到的偏差程度,或更多的偏差(这实际上是您的结果的频率p值)。

尝试使用红色投注策略进行此实验,您将看到差异有多小......