我有一些练习要用Rstudio来解决我的统计考试。 我试着用英语翻译,所以如果不清楚,请向我解释。
“模拟100,000名分娩并使用以下概率:男性占51.3%,女性占48.7%,使用样本功能。
检查所获得的男性和女性人数与理论百分比的差异。
绘制本实验概率函数的PMF和CDF(对50个出生的样本)。
计算分布的均值和方差。“
我获得了51356名男性和48644名女性,相差56.
但是现在,我如何绘制概率函数的PMF和CDF?
这里我把用来模拟出生的代码:
mysample <- data.frame(sample(c("M","F"),100000,replace=T,prob=c(0.513,0.487)))
names(mysample)<-c("Gender")
males <- subset(mysample, Gender=="M")
females <- subset(mysample,Gender=="F")
theoricM <- 100000*0.513
theoricF <- 100000*0.487
realM <- as.integer(nrow(maschi))
realF <- as.integer(nrow(femmine))
#create a data frame to show differences
result <-data.frame(realM,theoricM,realF,theoricF)
names(result)<- c("Males","Theoric Males","Females","Theoric Females")
结果:
希望有人可以帮助我,我知道对于有R经验的人来说这是一个非常简单的问题,但我刚开始使用这种语言。
非常感谢所有回复的人。
修改
我试过这段代码:
x <- 1:50
plot(x,dbinom(x ,size = 50,prob = 0.513),type="l", ylab="PMF", main="Binomial Distribution PMF")
结果是:
我认为我理解的是,在非常接近1/2的情况下,在一组50个出生时,男性的数量将非常接近25个。是什么情节显示?而且,这是正确的方法吗?
答案 0 :(得分:4)
您的代码(和结论)对我来说是正确的。
使用type="h"
绘制“高密度”情节可能在图形上更好;这使得x
的非整数值的概率为零的情况更加清楚。
x <- 1:50
par(las=1,bty="l") ## cosmetic
plot(x,dbinom(x ,size = 50,prob = 0.513),type="h", ylab="PMF",
main="Binomial Distribution PMF")
(当您绘制CDF / CMF时,您可能想要使用type="s"
或type="S"
;请参阅?plot
)