包含R中的异常值的Boxplot使得整个范围进行比较。

时间:2014-03-14 20:56:09

标签: r machine-learning statistics regression boxplot

我使用R比较几个值,它们是存储在1000个长度向量中的8个变量。这意味着,1000 * 8矩阵,8列代表8个变量。

然后我打电话给

boxplot(test),

我喜欢: 8个变量的平均值彼此非常接近。这使得比较和解释非常困难。我可以在我的情节中包含所有异常值吗?那么整个范围会更容易比较吗?或者可以给出任何其他建议来区分这些变量?

1 个答案:

答案 0 :(得分:0)

这是有问题的箱线图(因为OP没有发布图片的代表): boxplots

看起来中位数(也可能是手段)几乎完全相同,但八个类别之间的差异不同,其中类别1具有最低,8个具有最高方差。根据所涉及的实际问题,这两条信息(类似的中位数/均值,不同的方差)可能已经足够了。

如果您想要进行正式显着性测试,方差是否相等,您可以使用Hartley'sBartlett's测试。如果你想用不等方差正式检验平均值(因此ANOVA不合适),看看here