Question

数据集命令：

download.file("http://www.openintro.org/stat/data/atheism.RData", destfile ="atheism.RData")
load("atheism.RData")

问题：根据数据集，无神论者在美国的比例是多少（以百分比表示，四舍五入到两位小数）？

这就是我所做的：

我使用sum（）函数得到无神论者的总数，然后除以无神论者+非无神论者的总数。听起来对吗？例如：（无神论者）/（无神论者+非无神论者）

我的答案是：

0.05

我想在以下方面提供帮助的第二个问题

无神论者的样本比例（四舍五入）的置信区间的标准误是多少？

我的回答：0.0158

公式只是sqrt（（p（1-p）/ N））。

我不认为我被赋予了p，所以我默认使用0.5。因此，对于SQRT（（0.5）（1-0.5）/ 1002）），我通过添加无神论者+非无神论者得到1002，它的总大小为N。

似乎正确???

Answer 1

正如@Elin所说，这更多是统计问题，而不是编程问题。另外，open intro对于统计信息来说是很棒的文字，所以请阅读！

现在，由于您正在询问R问题，因此以下是您应了解的有关R的信息。但是，由于它是硬件，所以我不会为您编写解决方案。那不会对你有长远的帮助！

首先，要计算多少个元素具有一定水平的因子，您可以利用R将布尔值视为1和0的事实。因此，您可以对布尔向量求和以得到计数。

例如，虹膜数据集（有关更多详细信息，请参见“？iris”）具有因子种类。要获取级别为“ setosa”的Species变量的数量，请运行：

sum(iris$Species== "setosa")

要获得比例，可以除以变量的长度：

sum(iris$Species== "setosa") / length(iris$Species)

请注意，对我来说length(atheism$response)返回88032，而不是1002。通过将两个级别的无神论$响应相加，我得到相同的结果。我建议您仔细检查一下这是否是相同的数据集。

您需要自己计算标准误差。我建议仔细阅读文字和问题，因为我怀疑0.5不是p的正确值。

此外，关于R中算术的注释也已明确指定。但是对于新用户而言，可能会感到困惑。我建议尽可能使用括号。而且，即使形式为*（b + c），乘法也需要'*'运算符-不能像在代数a（b + c）中那样假定乘法。

如果您有更多R问题，请随时提问。但是，您必须学习统计信息！开放介绍是一本很棒的书，所以请充分利用它！