如何使wilcox.test适应我在R中的数据?

时间:2013-02-08 20:15:58

标签: r

我是R的新手,并尝试在我的数据上使用wilcox.test:我有一个数据帧36021X246,rownames为probeIDs,最后一行是一个标签,表示样本属于哪个组 - 第一个是“控制” 140,并为最后106人“待遇”。

我非常感谢知道在执行测试时如何定义这两个组....我无法在网上找到关于“公式”参数的更多信息,除了 -

“公式

形式为lhs~rhs的公式,其中lhs是给出数据值的数值变量,rhs是给出相应组的两个级别的因子。“

如果有人能够解释lhs~rhs的含义以及如何定义这个公式,我会非常感激。

谢谢!

1 个答案:

答案 0 :(得分:1)

R通常假定每行都是一个案例,而列是关联的变量。如果两个样本的案例都出现在同一个数据框中,则一列将成为样本成员资格的指示变量。我们的电话是IndSample。 Wilcoxon是一个单变量测试,因此您将有另一个列包含您正在测试的响应值。我们称之为Y.然后你写了

wilcox.test(y ~ IndSample, data=MyData, .....)

以及测试的其余参数:它是双面的吗?你想要一个准确的统计数据吗? (可能不是,在你的情况下。)

我认为您的数据就好。这对于数据框来说是个问题,因为您不能像使用矩阵一样从数据框中拉出一行。

你需要抓住最后一行并把它变成一个因子 - 比如

factor(c(MyData[lastrow,]))

然后拉出包含您的回复的行:

Y <- as.numeric(c(MyData[ResponseRow,]))

然后做wilcoxon。

但是,我不确定我是否正确理解了你的情况。对于适度的wilcoxon测试来说,这似乎是一个非常大的数据矩阵。