Question

我有一个非常大的OTU（丰度）表。每个样本有超过100个样本和4000个观察值（4000个分类单元）。

OTU表的一个例子如下：

#OTUID  1   2   3   4   5   6   7   8
OTU1    0   0   0   0   0   3   0   0
OTU2    0   0   0   0   0   0   13  0
OTU3    5   99  0   0   0   0   0   0
OTU4    0   0   0   0   0   0   0   0
OTU5    0   0   0   0   0   0   0   2
OTU6    0   0   19  0   9   236 59  2
OTU7    0   55  0   2   4   2   3   0
OTU8    0   44  10  5   0   0   7   0
OTU9    6   0   13  2   0   0   17  6
OTU10   0   100 0   0   0   3   0   0
OTU11   4   13  0   0   2   1   2   0
OTU12   0   0   0   0   0   101 1   0

我想以长格式获取此表，因此我可以在另一个表上的样本之间执行一些配对测试。我只对计数数据感兴趣，虽然如果我可以得到他们属于两个的样本和相应的OTU，我会接受它但是没有必要。数据应如下所示：

COUNT OTUID SAMPLEID
0     OTU1   1
0     OTU2   1
5     OTU3   1
0     OTU4   1
0     OTU5   1
0     OTU6   1
0     OTU7   1
0     OTU8   1
6     OTU9   1
0     OTU10  1
4     OTU11  1
0     OTU12  1
0     OTU1   2
0     OTU2   2
99    OTU3   2
0     OTU4   2

我的脚本似乎工作，虽然我确实得到它仍然运行的NO id变量错误消息。如果有人知道如何解决这个问题我会非常感激。

library(reshape2)
test = read.csv("test_otu.csv", sep=",", row.names=1)
test2 <- melt(test)
No ID variables; using all as measure variables
test2

请帮忙！

以宽到长的格式重塑非常大的OTU（丰度）表 - 400,000次观测

0 个答案: