我正在使用Python,我使用this tutorial实现了PCA。
一切都很好,我得到了协方差,我做了一个成功的转换,使它对原始尺寸没有问题。
但我该如何进行美白?我尝试用特征值划分特征向量:
S, V = numpy.linalg.eig(cov)
V = V / S[:, numpy.newaxis]
并使用V来转换数据但这导致了奇怪的数据值。 请问有人可以对此有所了解吗?
答案 0 :(得分:17)
这是我从here得到的一些用于矩阵白化的Matlab代码的实现。
import numpy as np
def whiten(X,fudge=1E-18):
# the matrix X should be observations-by-components
# get the covariance matrix
Xcov = np.dot(X.T,X)
# eigenvalue decomposition of the covariance matrix
d, V = np.linalg.eigh(Xcov)
# a fudge factor can be used so that eigenvectors associated with
# small eigenvalues do not get overamplified.
D = np.diag(1. / np.sqrt(d+fudge))
# whitening matrix
W = np.dot(np.dot(V, D), V.T)
# multiply by the whitening matrix
X_white = np.dot(X, W)
return X_white, W
您还可以使用SVD对矩阵进行白化:
def svd_whiten(X):
U, s, Vt = np.linalg.svd(X, full_matrices=False)
# U and Vt are the singular matrices, and s contains the singular values.
# Since the rows of both U and Vt are orthonormal vectors, then U * Vt
# will be white
X_white = np.dot(U, Vt)
return X_white
第二种方式有点慢,但可能在数值上更稳定。
答案 1 :(得分:5)
如果你使用python的scikit-learn库,你可以设置内置参数
document.getElementById('inputID').readOnly = true;
答案 2 :(得分:1)
我认为你需要转置V并取S的平方根。所以公式是
matrix_to_multiply_with_data = transpose(v)* s ^( - 1/2)