我想比较两个数据集1和2,以表明它们是相似的:
日期设定1(矢量):1 1 2 3 1 2 1 3 4 1平均值:1.9
数据集2(向量):2 2 1 2 2 1 1 2 2 3 2 2平均值:1.83
我需要使用 t-test 进行多次测试校正,如Bonferroni。我尝试过multcompare,但我不确定如何将它链接到t-test。
有人可以举出一个简单的例子吗?
答案 0 :(得分:2)
您不能使用基于“无差异”的零假设(如t检验)的测试来表明两件事情相似(不同)。 null假设检验只能说是否有足够的证据来证明零假设是错误的,而不是它是真的。
在这里转向多重比较校正也是不正确的,原因有二:1。显然你只想这样做,因为你不喜欢测试的结果。由于结果而改变测试程序伪造它。在一些科学分支中这是一种常见做法的情况并没有改变这一事实。你只是在两个样本之间进行一次比较。 没有多次比较,无法在您的应用程序中进行更正。
由于t检验告诉您两个数据集之间存在差异,因此您不能简单地假设没有数据集。但是,差异重要(因此可能是真实的)的情况并不意味着相关。因此,我建议您认为两个数据集之间存在一个小的,统计上显着但无关的区别。但是,此处使用的“相关性”不是统计概念,并且没有推理统计的工具可以帮助您定义相关性。您需要根据您的应用程序或您所在领域常用的一些标准级别进行参数。
在某些字段中,相关性通常根据效果的统计大小来定义。对于t检验,效应大小的常用度量是Cohen's d。它大致等于t值乘以sqrt(n1 + n2 - 2)
。 Cohen(1992,“A power primer”)建议称d为0.2“小”,0.5“中”和0.8“大”。