数据集命令:
download.file("http://www.openintro.org/stat/data/atheism.RData", destfile ="atheism.RData")
load("atheism.RData")
问题: 根据数据集,无神论者在美国的比例是多少(以百分比表示,四舍五入到两位小数)?
这就是我所做的:
我使用sum()函数得到无神论者的总数,然后除以无神论者+非无神论者的总数。听起来对吗?例如:(无神论者)/(无神论者+非无神论者)
我的答案是:
0.05
我想在以下方面提供帮助的第二个问题
无神论者的样本比例(四舍五入)的置信区间的标准误是多少?
我的回答:0.0158
公式只是sqrt((p(1-p)/ N))。
我不认为我被赋予了p,所以我默认使用0.5。 因此,对于SQRT((0.5)(1-0.5)/ 1002)),我通过添加无神论者+非无神论者得到1002,它的总大小为N。
似乎正确???
答案 0 :(得分:-2)
正如@Elin所说,这更多是统计问题,而不是编程问题。另外,open intro对于统计信息来说是很棒的文字,所以请阅读!
现在,由于您正在询问R问题,因此以下是您应了解的有关R的信息。但是,由于它是硬件,所以我不会为您编写解决方案。那不会对你有长远的帮助!
首先,要计算多少个元素具有一定水平的因子,您可以利用R将布尔值视为1和0的事实。因此,您可以对布尔向量求和以得到计数。
例如,虹膜数据集(有关更多详细信息,请参见“?iris”)具有因子种类。要获取级别为“ setosa”的Species变量的数量,请运行:
sum(iris$Species== "setosa")
要获得比例,可以除以变量的长度:
sum(iris$Species== "setosa") / length(iris$Species)
请注意,对我来说length(atheism$response)
返回88032,而不是1002。通过将两个级别的无神论$响应相加,我得到相同的结果。我建议您仔细检查一下这是否是相同的数据集。
您需要自己计算标准误差。我建议仔细阅读文字和问题,因为我怀疑0.5不是p的正确值。
此外,关于R中算术的注释也已明确指定。但是对于新用户而言,可能会感到困惑。我建议尽可能使用括号。而且,即使形式为*(b + c),乘法也需要'*'运算符-不能像在代数a(b + c)中那样假定乘法。
如果您有更多R问题,请随时提问。但是,您必须学习统计信息!开放介绍是一本很棒的书,所以请充分利用它!