PCA on Control和处理不同时间点的数据并进行重复

时间:2016-08-29 09:11:45

标签: r pca

我是PCA的新手,所以我很困惑。我有一个数据有12个样本,其中6个是对照,6个是治疗。每个对照和处理有2个时间点,每个时间点有3个重复,总共12个样本。

我的数据如下:

update_post_meta($post_id,'username_name', $line_of_text[1]);

现在我想对这些数据进行PCA,显示每个基因,对照样品的点和处理样品的点(计算对照和处理基因之间的欧氏距离)。前6个样品应作为控制点,最后6个样品应作为处理对象。 注意:我需要在PCA图上绘制基因,用于对照和处理样品(不是自己的样品)。

我做了PCA,但是它获取了所有数据并给出了每个基因的一个点,而不是单独的控制点和每个基因的处理。我怎么处理这个?有人可以帮忙吗?

1 个答案:

答案 0 :(得分:2)

DF <- read.table( text = "   C21 C22  C23 C41 C42 C43 T21 T22 T23 T41 T42 T43
                  ENSG00000000003        660  451 493 355 495 444 743 259 422 204 149 623
                  ENSG00000000005           0 0   0   0   0   0   0   0   0   0   0   0
                  ENSG00000000419         978 928 1161 641 810 807 1265 361 998 326 239 1055
                  ENSG00000000457        234 248 444  192 218 326 615 122 395 134 100 406
                  ENSG00000000460    1096 919 1253 693 907 1185 1648 381 1119 422 269 1267", header = TRUE)

只需在PCA之前重新排列输入数据。控制和治疗观察应该在彼此之下。

DFc <- DF[, 1:6] 
DFt <- DF[, 7:12]

names(DFc) <- gsub("[[:alpha:]*]", "", names(DFc))
names(DFt) <- gsub("[[:alpha:]*]", "", names(DFt))
rownames(DFt) <- paste0(rownames(DFt), "_t")

DF1 <- rbind(DFc, DFt)

summary(pca <- princomp(DF1))

biplot(pca)

请注意,此答案并不支持您的统计方法,只能回答编程问题。