我对R比较陌生。对于我的任务,我必须首先考察政治家(保守派或工党)财富对其真实财富和实际净财富的影响,进行T检验。 。我必须尝试使用简单的t检验来估计服务于办公室财富的效果。
数据集名为takehome.dta
工党和托利党是二元的,其中1表示他们为该党服务,否则为0。
财富的变量是lnrealgross和lnrealnet。
我已经导入并附加了数据集,但是当我尝试进行简单的t检验时。我得到以下消息"分组因子必须正好有2个级别。"不太确定我哪里出错了。任何援助将不胜感激!
答案 0 :(得分:10)
t.test(y~x)
当你的意思是这样做时
t.test(y,x)
一般情况下使用~
,您就会有
y <- 1:10
x <- rep(letters[1:2], each = 5)
当您有等数据时,和,
y <- 1:5
x <- 6:10
我假设您正在做类似的事情:
y <- 1:10
x <- rep(1,10)
t.test(y~x) #instead of t.test(y,x)
因为错误表明分组因子x
答案 1 :(得分:3)
〜和之间的差异是您正在运行的统计测试的类型。 〜给你平均差异。这适用于依赖样本(例如之前和之后)。 ,给你差异的手段。这适用于独立样品(例如处理和对照)。这两个测试不可互换。
答案 2 :(得分:0)
我遇到了类似的问题,并且在给定数据集大小的情况下,我没有意识到y之一对我的一个水平没有值。我对两组进行了一系列基因读取,而一个基因仅对第2组进行了读取,而对第1组没有进行读取。我什至没有注意到,但是由于某种原因,它呈现出与我同样会得到的错误相同的错误。许多级别。解决方案是从分析中删除y或我的情况下的基因,然后解决错误。