对大集合中的一小部分数据进行T.test

时间:2019-11-20 07:03:42

标签: r dataset sample

我们将一组的平均值(或平均值)与设定的平均值(或平均值)进行比较。此设定平均值可以是任何理论值(也可以是总体平均值)。

我正在尝试使用单侧t检验来计算一小组300个观察值与1500个观察值的平均平均值,这种方法正确吗?如果没有,还有其他选择吗?

    head(data$BMI)
    attach(data)
    tester<-mean(BMI)
    table(BMI)
    set.seed(123)
    sampler<-sample(min(BMI):max(BMI),300,replace = TRUE)
    mean(sampler)
    t.test(sampler,tester)

代码的最后一行产生-     t.test.default(sampler,tester)中的错误:“ y”个观测值不足

1 个答案:

答案 0 :(得分:0)

要在t.test中测试样品,您可以执行以下操作:

d <- rnorm(1500,mean = 3, sd = 1)
s <- sample(d,300)

然后,测试ds的正常性:

> shapiro.test(d)

    Shapiro-Wilk normality test

data:  d
W = 0.9993, p-value = 0.8734

> shapiro.test(s)

    Shapiro-Wilk normality test

data:  s
W = 0.99202, p-value = 0.1065

此处的测试优于0.05,因此您可以考虑ds都是正态分布的。因此,您可以测试t.test:

> t.test(d,s)

    Welch Two Sample t-test

data:  d and s
t = 0.32389, df = 444.25, p-value = 0.7462
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.09790144  0.13653776
sample estimates:
mean of x mean of y 
 2.969257  2.949939