我想知道是否需要在R中的样本上转置数据以进行PCA。我正在使用内置函数prcomp()。我的数据集是RNA seq表达数据,列是样本,行是基因表达。它似乎无论哪种方式都有效,但对于行/列中应该有什么共识?谢谢!
答案 0 :(得分:0)
大多数生物统计学R包通过转置数据框来实现这一点。我会给你一个证明:
RUV SVD因子分解方法在RNA-Seq中很常见。看看它的源代码:
https://github.com/drisso/RUVSeq/blob/master/R/RUVg-methods.R
if(isLog) {
Y <- t(x)
} else {
Y <- t(log(x+epsilon))
}
x
是基因矩阵表。你看到转置操作吗?稍后在代码中,包将转置矩阵(Y)赋予svd
函数。
svdWa <- svd(...)
为了让生活和其他人更轻松,您可能希望将基因放入您的行和样本中。