为什么R的t检验功能存在错误和/或不一致的自由度?

时间:2016-08-12 16:38:58

标签: r rounding t-test

我有一个简单的问题。我在R中看到了t检验和相关性的这种行为。

我做了一个简单的配对t检验(在这种情况下,两个长度为100的向量)。所以配对t检验的df应该是99.但是这不是t检验结果输出中出现的。

dataforTtest.x <- rnorm(100,3,1)
dataforTtest.y <- rnorm(100,1,1)
t.test(dataforTtest.x, dataforTtest.y,paired=TRUE)

输出是:

Paired t-test

data:  dataforTtest.x and dataforTtest.y
t = 10, df = 100, p-value <2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
1.6 2.1
sample estimates:
mean of the differences 
                1.8 

但是,如果我实际查看结果对象,则df是正确的。

> t.test(dataforTtest.x, dataforTtest.y,paired=TRUE)[["parameter"]]

df 
99 

我错过了一些非常愚蠢的东西吗? 我正在运行R版本3.3.0(2016-05-03)

1 个答案:

答案 0 :(得分:1)

如果舍入数字的全局设置在R中发生变化,可能会发生此问题,这可以通过选项(数字= 2)来完成。

在更改此设置之前,请注意t检验的结果:

    Paired t-test

data:  dataforTtest.x and dataforTtest.y
t = 13.916, df = 99, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 1.700244 2.265718
sample estimates:
mean of the differences 
               1.982981 

设置选项(数字= 2)后:

Paired t-test

data:  dataforTtest.x and dataforTtest.y
t = 13.916, df = 100, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 1.700244 2.265718
sample estimates:
mean of the differences 
                      2 

在R中,出于这个原因更改全局设置可能会很危险。没有用户的知识,它可以完全改变统计分析的结果。相反,我们可以直接在数字上使用round()函数,或者对于这样的测试结果,我们可以将它与扫帚包结合使用。

round(2.949,2)
[1] 2.95

#and

require(broom)

glance(t.test(dataforTtest.x, dataforTtest.y,paired=TRUE))

estimate statistic      p.value parameter cnf.low cnf.high       method alternative
1.831433  11.31853 1.494257e-19        99 1.51037 2.152496 Paired t-test  two.sided