我正在开设一个课堂项目:这是关于四种不同法国轮盘(37号)策略的统计评估。 前两个非常简单:
请找到以下代码:
BettingOnRed <- function(){
ball <- sample(1:37, 1, replace=TRUE)
if(ball <= 18) amount_won <- 1
else amount_won <- -1
c(amount_won, 1)
}
BettingOnNumber <- function() {
myNumber <- 17
ball <- sample(0:36, 1, replace=TRUE)
if(myNumber == ball) amount_won <- 35
else amount_won <- -1
c(amount_won, 1)
}
每个函数返回一个length = 2
向量,其中包含赢得的金额和投注数量(在这两个函数中总是等于1:此值在其他策略中起作用...)。
即使它们看起来很简单,如果我们计算预期奖金的百分比误差和每场比赛的胜利比例,我们部分会得到巨大的错误。请参阅下表:
为了计算预期值,我设置了一个函数simulation()
,它会重复每个游戏100,000次并计算你在表格中找到的值。
我不明白的是:为什么每场比赛B的奖金百分比误差如此之大,而B赢得的比赛的百分比误差是如此之小?
请在此处找到我们用于计算游戏B的确切值和百分比误差的公式:
EstWin
为每场比赛B的奖金估算。EstProp
估算B赢得的比赛。各自的确切值为:
百分比错误:
您如何解释此错误?为什么B的错误不一样?我在这里错过了一个关于概率的重要事实吗?
在下面找到我的函数'simulation'的负责部分: (作为第一个参数,它需要上面两个函数中的一个)
simulation <- function(f, n = 100000){
result <- numeric(8)
winnings <- numeric(n)
games_won <- numeric(n)
for (i in 1:n){
fnct <- f()
winnings[i] <- fnct[1]
games_won[i] <- ifelse(fnct[1] > 0, 1, 0)
}
result[1] <- mean(winnings)
result[2] <- mean(games_won)
result
}
请注意,这不是整个功能,我只是删除了此问题的不必要部分。
答案 0 :(得分:1)
tl; dr 您的结果似乎是正确的;比您想象的更多变化(数字下注的变化很多大于下注红色的变化......)
您的模拟有很多方面可以简化,但我认为您的基本框架是正确的。真的,你唯一缺少的是输出中预期的变化量;如果你仔细观察,你会发现观察到的与预期之间的偏差确实不足为奇。 (你实际上可以通过分析来计算这种方差,但在这里我会用蛮力来做。)
模拟100次运行,每次运行100,000次。我方便地使用plyr::raply()
(它会自动汇总您的结果并实现进度条),但您也可以使用replicate()
或for
循环执行此操作
set.seed(101)
library(plyr)
rr <- raply(100,simulation(BettingOnNumber,100000),.progress="text")
绘制平均奖金的分布:蓝色=预期,红色=从单次模拟中观察到。
par(las=1,bty="l")
hist(rr[,1],col="gray",breaks=30,
xlab="mean amount won in 100,000 games",
ylab="Frequency (100 runs)")
exp_val <- -0.02703
obs_val <- -0.04852
abline(v=c(obs_val,exp_val),col=c("red","blue"),lwd=2)
这里计算出这种程度的偏差是多么令人惊讶:
mean(abs(rr[,1]-exp_val)>abs(obs_val-exp_val)) ## 0.21
这意味着您可以在21%的时间内获得您所看到的预期和观察到的偏差程度,或更多的偏差(这实际上是您的结果的频率p值)。
尝试使用红色投注策略进行此实验,您将看到差异有多小......