Question

我是R的新手，并尝试在我的数据上使用wilcox.test：我有一个数据帧36021X246，rownames为probeIDs，最后一行是一个标签，表示样本属于哪个组 - 第一个是“控制” 140，并为最后106人“待遇”。

我非常感谢知道在执行测试时如何定义这两个组....我无法在网上找到关于“公式”参数的更多信息，除了 -

“公式

形式为lhs~rhs的公式，其中lhs是给出数据值的数值变量，rhs是给出相应组的两个级别的因子。“

如果有人能够解释lhs~rhs的含义以及如何定义这个公式，我会非常感激。

谢谢！

Answer 1

R通常假定每行都是一个案例，而列是关联的变量。如果两个样本的案例都出现在同一个数据框中，则一列将成为样本成员资格的指示变量。我们的电话是IndSample。 Wilcoxon是一个单变量测试，因此您将有另一个列包含您正在测试的响应值。我们称之为Y.然后你写了

wilcox.test(y ~ IndSample, data=MyData, .....)

以及测试的其余参数：它是双面的吗？你想要一个准确的统计数据吗？（可能不是，在你的情况下。）

我认为您的数据就好。这对于数据框来说是个问题，因为您不能像使用矩阵一样从数据框中拉出一行。

你需要抓住最后一行并把它变成一个因子 - 比如

factor(c(MyData[lastrow,]))

然后拉出包含您的回复的行：

Y <- as.numeric(c(MyData[ResponseRow,]))

然后做wilcoxon。

但是，我不确定我是否正确理解了你的情况。对于适度的wilcoxon测试来说，这似乎是一个非常大的数据矩阵。