Question

我写信询问您对如何解释此案的意见。我有两个向量“a”和“b”，我试图比较。

wilcoxon测试给出了一个p值为5.139217e-303的超过b的替代“更大”。现在，如果我对每个摘要进行总结，我有以下内容

> summary(a)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0000000 0.0001411 0.0002381 0.0002671 0.0003623 0.0012910 
> summary(c)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0000000 0.0000000 0.0000000 0.0004947 0.0002972 1.0000000

然后平均比率约为0.5399031，这与wilcoxon测试的方向相反（我期望找到比率> 1）

即使在使用异常值包删除异常值后，我仍然有同样的事情。有人可以帮我解释为什么我有这个结果以及如何解释它？

提前致谢

Answer 1

由于您尚未发布数据，这确实是一个棘手的问题，并且发布您的数据（例如，通过dput()会使事情变得更容易。除此之外，我们只能指定。请参阅{{3}有关使用可重现的示例提出一个好问题的更多信息。

但是，您的数据有一些我们可以从summary看到的属性，可以给出答案。

Wilcoxon测试似乎不适合您的数据。请记住，威尔科克森使用每个观察的等级。由于数据中存在联系，因此很难获得排名。您似乎有很多关系（min和median c都是0）。有办法处理关系，但其他方法更好。

因为你似乎不想使用t检验（假设分布似乎真的不同，例如median(a) < mean (a)但是median(c) > mean(c)），另一种方法是使用排列检验

我的包afex（在CRAN上，基于coin）包含使用（例如）t-test，Wilcoxon和最显着的排列测试比较两个向量的函数compare.2.vectors。如果您的n很小，您甚至可以使用精确的测试分布进行置换测试。给定两个向量a和c，结果可能是（试图模拟您的数据）：

> require(afex)
> a <- round(runif(100, 0, 0.00129), 5)
> c <- c(rep(0, 60), runif(37, 0, 0.00297), rep(1, 3))
> summary(a)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
0.0000100 0.0002775 0.0006500 0.0006360 0.0009475 0.0012800 
> summary(c)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
0.00000 0.00000 0.00000 0.03054 0.00116 1.00000 

> compare.2.vectors(a,c)
$parametric
   test test.statistic test.value   test.df          p
1     t              t  -1.745388 198.00000 0.08246866
2 Welch              t  -1.745388  99.00094 0.08402002

$nonparametric
             test test.statistic  test.value test.df            p
1 stats::Wilcoxon              W 6772.000000      NA 1.143036e-05
2     permutation              Z   -1.736482      NA 1.929300e-01
3  coin::Wilcoxon              Z    4.389418      NA 0.000000e+00
4          median              Z   -4.514156      NA 0.000000e+00

您会看到相同的模式，Wilcoxon的正面测试统计数据，但对所有其他测试都是负面的。所以最好不要使用Wilcoxon，而是其他测试之一，都同意。

PS：我很高兴有关该功能的评论。还有更多有意义的测试吗？

wilcoxon测试和平均比率

1 个答案: