要运行Canonical对应分析(cca包ade4),我需要一个正定方差矩阵。 (理论上总是如此) 但是:
matrix(c(2,59,4,7,10,0,7,0,0,0,475,18714,4070,97,298,0,1,0,17,7,4,1,4,18,36),nrow=5)
> a
[,1] [,2] [,3] [,4] [,5]
[1,] 2 0 475 0 4
[2,] 59 7 18714 1 1
[3,] 4 0 4070 0 4
[4,] 7 0 97 17 18
[5,] 10 0 298 7 36
> eigen(var(a))
$values
[1] 6.380066e+07 1.973658e+02 3.551492e+01 1.033096e+01
[5] -1.377693e-09
最后的特征值是 -1.377693e-09 ,其是<但理论值是> 0
如果其中一个特征值是<不能运行该函数。 0
我真的不知道如何在不改变函数cca()
的代码的情况下解决这个问题感谢您的帮助
答案 0 :(得分:4)
您可以稍微改变输入,使矩阵为正定。
如果您有方差矩阵,则可以截断特征值:
correct_variance <- function(V, minimum_eigenvalue = 0) {
V <- ( V + t(V) ) / 2
e <- eigen(V)
e$vectors %*% diag(pmax(minimum_eigenvalue,e$values)) %*% t(e$vectors)
}
v <- correct_variance( var(a) )
eigen(v)$values
# [1] 6.380066e+07 1.973658e+02 3.551492e+01 1.033096e+01 1.326768e-08
使用奇异值分解,您可以直接使用a
执行相同的操作。
truncate_singular_values <- function(a, minimum = 0) {
s <- svd(a)
s$u %*% diag( ifelse( s$d > minimum, s$d, minimum ) ) %*% t(s$v)
}
svd(a)$d
# [1] 1.916001e+04 4.435562e+01 1.196984e+01 8.822299e+00 1.035624e-01
eigen(var( truncate_singular_values(a,.2) ))$values
# [1] 6.380066e+07 1.973680e+02 3.551494e+01 1.033452e+01 6.079487e-09
但是,这会将矩阵a
最多更改为0.1
,这很多
(我怀疑它很高,因为矩阵a
是正方形的:因此,
var(a)
的一个特征值恰好为0。)
b <- truncate_singular_values(a,.2)
max( abs(b-a) )
# [1] 0.09410187
我们实际上可以通过添加一些噪音来做得更好。
b <- a + 1e-6*runif(length(a),-1,1) # Repeat if needed
eigen(var(b))$values
# [1] 6.380066e+07 1.973658e+02 3.551492e+01 1.033096e+01 2.492604e-09
答案 1 :(得分:3)
以下是两种方法:
V <- var(a)
# 1
library(Matrix)
nearPD(V)$mat
# 2 perturb diagonals
eps <- 0.01
V + eps * diag(ncol(V))