以宽到长的格式重塑非常大的OTU(丰度)表 - 400,000次观测

时间:2016-08-17 21:06:02

标签: r reshape reshape2 tidyr qiime

我有一个非常大的OTU(丰度)表。每个样本有超过100个样本和4000个观察值(4000个分类单元)。

OTU表的一个例子如下:

#OTUID  1   2   3   4   5   6   7   8
OTU1    0   0   0   0   0   3   0   0
OTU2    0   0   0   0   0   0   13  0
OTU3    5   99  0   0   0   0   0   0
OTU4    0   0   0   0   0   0   0   0
OTU5    0   0   0   0   0   0   0   2
OTU6    0   0   19  0   9   236 59  2
OTU7    0   55  0   2   4   2   3   0
OTU8    0   44  10  5   0   0   7   0
OTU9    6   0   13  2   0   0   17  6
OTU10   0   100 0   0   0   3   0   0
OTU11   4   13  0   0   2   1   2   0
OTU12   0   0   0   0   0   101 1   0

我想以长格式获取此表,因此我可以在另一个表上的样本之间执行一些配对测试。我只对计数数据感兴趣,虽然如果我可以得到他们属于两个的样本和相应的OTU,我会接受它但是没有必要。数据应如下所示:

COUNT OTUID SAMPLEID
0     OTU1   1
0     OTU2   1
5     OTU3   1
0     OTU4   1
0     OTU5   1
0     OTU6   1
0     OTU7   1
0     OTU8   1
6     OTU9   1
0     OTU10  1
4     OTU11  1
0     OTU12  1
0     OTU1   2
0     OTU2   2
99    OTU3   2
0     OTU4   2

我的脚本似乎工作,虽然我确实得到它仍然运行的NO id变量错误消息。如果有人知道如何解决这个问题我会非常感激。

library(reshape2)
test = read.csv("test_otu.csv", sep=",", row.names=1)
test2 <- melt(test)
No ID variables; using all as measure variables
test2

请帮忙!

0 个答案:

没有答案