Basic - T-Test - >分组因子必须精确到2个级别

时间:2015-04-02 20:01:41

标签: r grouping factors

我对R比较陌生。对于我的任务,我必须首先考察政治家(保守派或工党)财富对其真实财富和实际净财富的影响,进行T检验。 。我必须尝试使用​​简单的t检验来估计服务于办公室财富的效果。

数据集名为takehome.dta

工党和托利党是二元的,其中1表示他们为该党服务,否则为0。

财富的变量是lnrealgross和lnrealnet。

我已经导入并附加了数据集,但是当我尝试进行简单的t检验时。我得到以下消息"分组因子必须正好有2个级别。"不太确定我哪里出错了。任何援助将不胜感激!

3 个答案:

答案 0 :(得分:10)

你是这样做的吗?

t.test(y~x)

当你的意思是这样做时

t.test(y,x)

一般情况下使用~,您就会有

等数据
y <- 1:10
x <- rep(letters[1:2], each = 5)
当您有

等数据时,

,

y <- 1:5
x <- 6:10

我假设您正在做类似的事情:

y <- 1:10
x <- rep(1,10)
t.test(y~x) #instead of t.test(y,x)

因为错误表明分组因子x

没有变化

答案 1 :(得分:3)

〜和之间的差异是您正在运行的统计测试的类型。 〜给你平均差异。这适用于依赖样本(例如之前和之后)。 ,给你差异的手段。这适用于独立样品(例如处理和对照)。这两个测试不可互换。

答案 2 :(得分:0)

我遇到了类似的问题,并且在给定数据集大小的情况下,我没有意识到y之一对我的一个水平没有值。我对两组进行了一系列基因读取,而一个基因仅对第2组进行了读取,而对第1组没有进行读取。我什至没有注意到,但是由于某种原因,它呈现出与我同样会得到的错误相同的错误。许多级别。解决方案是从分析中删除y或我的情况下的基因,然后解决错误。