Question

我正在开设一个课堂项目：这是关于四种不同法国轮盘（37号）策略的统计评估。前两个非常简单：

甲。投注红色一次
B中。投注第一名

请找到以下代码：

BettingOnRed <- function(){
  ball <- sample(1:37, 1, replace=TRUE)  
  if(ball <= 18)  amount_won <- 1
  else            amount_won <- -1
  c(amount_won, 1)
}

BettingOnNumber <- function() {
  myNumber <- 17
  ball <- sample(0:36, 1, replace=TRUE)
  if(myNumber == ball)  amount_won <- 35
  else                  amount_won <- -1
  c(amount_won, 1)
}

每个函数返回一个length = 2向量，其中包含赢得的金额和投注数量（在这两个函数中总是等于1：此值在其他策略中起作用...）。

即使它们看起来很简单，如果我们计算预期奖金的百分比误差和每场比赛的胜利比例，我们部分会得到巨大的错误。请参阅下表：

Click to see the table

为了计算预期值，我设置了一个函数simulation()，它会重复每个游戏100,000次并计算你在表格中找到的值。

我不明白的是：为什么每场比赛B的奖金百分比误差如此之大，而B赢得的比赛的百分比误差是如此之小？

请在此处找到我们用于计算游戏B的确切值和百分比误差的公式：

让EstWin为每场比赛B的奖金估算。
让EstProp估算B赢得的比赛。

各自的确切值为：

ExactWin = 1/37 * 35 - 36/37 = -1/37
ExactProp = 1/37

百分比错误：

PercErrorWin =（EstWin - ExactWin）/ ExactWin
PercErrorProp =（EstProp - ExactProp）/ ExactProp

您如何解释此错误？为什么B的错误不一样？我在这里错过了一个关于概率的重要事实吗？

在下面找到我的函数'simulation'的负责部分：（作为第一个参数，它需要上面两个函数中的一个）

simulation <- function(f, n = 100000){
  result <- numeric(8)
  winnings <- numeric(n)
  games_won <- numeric(n)
  for (i in 1:n){
    fnct <- f()
    winnings[i]  <- fnct[1]
    games_won[i] <- ifelse(fnct[1] > 0, 1, 0)
  }
  result[1] <- mean(winnings)
  result[2] <- mean(games_won)
  result
}

请注意，这不是整个功能，我只是删除了此问题的不必要部分。

Answer 1

tl; dr 您的结果似乎是正确的;比您想象的更多变化（数字下注的变化很多大于下注红色的变化......）

您的模拟有很多方面可以简化，但我认为您的基本框架是正确的。真的，你唯一缺少的是输出中预期的变化量;如果你仔细观察，你会发现观察到的与预期之间的偏差确实不足为奇。（你实际上可以通过分析来计算这种方差，但在这里我会用蛮力来做。）

模拟100次运行，每次运行100,000次。我方便地使用plyr::raply()（它会自动汇总您的结果并实现进度条），但您也可以使用replicate()或for循环执行此操作

set.seed(101)
library(plyr)
rr <- raply(100,simulation(BettingOnNumber,100000),.progress="text")

绘制平均奖金的分布：蓝色=预期，红色=从单次模拟中观察到。

par(las=1,bty="l")
hist(rr[,1],col="gray",breaks=30,
     xlab="mean amount won in 100,000 games",
     ylab="Frequency (100 runs)")
exp_val <- -0.02703
obs_val <- -0.04852
abline(v=c(obs_val,exp_val),col=c("red","blue"),lwd=2)

这里计算出这种程度的偏差是多么令人惊讶：

mean(abs(rr[,1]-exp_val)>abs(obs_val-exp_val)) ## 0.21

这意味着您可以在21％的时间内获得您所看到的预期和观察到的偏差程度，或更多的偏差（这实际上是您的结果的频率p值）。

尝试使用红色投注策略进行此实验，您将看到差异有多小......

计算法国轮盘赌估算时出现无法解释的百分比误差

1 个答案: