Question

我对R比较陌生。对于我的任务，我必须首先考察政治家（保守派或工党）财富对其真实财富和实际净财富的影响，进行T检验。。我必须尝试使用简单的t检验来估计服务于办公室财富的效果。

数据集名为takehome.dta

工党和托利党是二元的，其中1表示他们为该党服务，否则为0。

财富的变量是lnrealgross和lnrealnet。

我已经导入并附加了数据集，但是当我尝试进行简单的t检验时。我得到以下消息＆＃34;分组因子必须正好有2个级别。＆＃34;不太确定我哪里出错了。任何援助将不胜感激！

Answer 1

你是这样做的吗？

t.test(y~x)

当你的意思是这样做时

t.test(y,x)

一般情况下使用~，您就会有

等数据

y <- 1:10
x <- rep(letters[1:2], each = 5)

当您有

等数据时，

和,

y <- 1:5
x <- 6:10

我假设您正在做类似的事情：

y <- 1:10
x <- rep(1,10)
t.test(y~x) #instead of t.test(y,x)

因为错误表明分组因子x

没有变化

Answer 2

〜和之间的差异是您正在运行的统计测试的类型。〜给你平均差异。这适用于依赖样本（例如之前和之后）。，给你差异的手段。这适用于独立样品（例如处理和对照）。这两个测试不可互换。

Answer 3

我遇到了类似的问题，并且在给定数据集大小的情况下，我没有意识到y之一对我的一个水平没有值。我对两组进行了一系列基因读取，而一个基因仅对第2组进行了读取，而对第1组没有进行读取。我什至没有注意到，但是由于某种原因，它呈现出与我同样会得到的错误相同的错误。许多级别。解决方案是从分析中删除y或我的情况下的基因，然后解决错误。

Basic - T-Test - ＆gt;分组因子必须精确到2个级别

3 个答案: