你能否解释一下为什么某些特征向量(2-4)存在符号差异?这种差异是否会影响进一步计算的进一步计算,例如降维?
Matlab的:
N = 5000;
dataA = rand(N,5);
covA = cov(dataA);
%covA = dataA*dataA'/(length(dataA)-1);
covA = covA + eps.*eye(size(covA));
[~,pA] = chol(covA);
assert(pA==0,'A is not possitive definite')
dataB = rand(N,5);
covB = cov(dataB);
%covB = dataB*dataB'/(length(dataB)-1);
covB = covB + eps.*eye(size(covB));
[~,pB] = chol(covB);
assert(pB==0,'B is not possitive definite')
[V,D] = eig(covA, covB);
V =
-0.4241 -1.0891 1.8175 2.4067 -1.3032
1.4445 -1.8960 -1.4118 -0.6514 -2.0075
0.1214 -2.5039 0.3332 -0.1705 2.3609
-2.1235 -0.7007 1.1632 -2.1532 -1.0554
-2.2599 -0.4405 -2.2236 1.2545 0.0760
的Python:
from scipy.linalg import eigh
import scipy.io
import numpy as np
cov_mat = scipy.io.loadmat('cov.mat')
covA = cov_mat['covA']
covB = cov_mat['covB']
eigvals, eigvecs = eigh(covA, covB, eigvals_only=False)
np.savetxt('eigvals.txt', eigvals, fmt='%.4f')
np.savetxt('eigvecs.txt', eigvecs, fmt='%.4f')
eigvecs =
0.4241 1.0891 -1.8175 -2.4067 -1.3032
-1.4445 1.8960 1.4118 0.6514 -2.0075
-0.1214 2.5039 -0.3332 0.1705 2.3609
2.1235 0.7007 -1.1632 2.1532 -1.0554
2.2599 0.4405 2.2236 -1.2545 0.0760
答案 0 :(得分:4)
它们是相同的特征向量,因为在特征向量上翻转符号不会改变它们的公式 - 它们将具有相同的特征值。结果不会影响进一步的计算。
为什么的计算方式不同? 很可能是因为运行的子程序根据正在操作的矩阵而有所不同,并且不在乎什么'签署'他们回来是因为特征值没有。
一个简单的数学证明:
如果x
是具有特征值A
的矩阵q
的特征向量,那么根据定义,我们有Ax = qx
。
遵循A(-x) = -(Ax) = -(qx) = q(-x)
使得-x
是具有相同特征值的特征向量。