我正在试图弄清楚如何使用PCA来解析python中的RGB图像。 我正在使用O'Reilly计算机愿景书中的代码:
from PIL import Image
from numpy import *
def pca(X):
# Principal Component Analysis
# input: X, matrix with training data as flattened arrays in rows
# return: projection matrix (with important dimensions first),
# variance and mean
#get dimensions
num_data,dim = X.shape
#center data
mean_X = X.mean(axis=0)
for i in range(num_data):
X[i] -= mean_X
if dim>100:
print 'PCA - compact trick used'
M = dot(X,X.T) #covariance matrix
e,EV = linalg.eigh(M) #eigenvalues and eigenvectors
tmp = dot(X.T,EV).T #this is the compact trick
V = tmp[::-1] #reverse since last eigenvectors are the ones we want
S = sqrt(e)[::-1] #reverse since eigenvalues are in increasing order
else:
print 'PCA - SVD used'
U,S,V = linalg.svd(X)
V = V[:num_data] #only makes sense to return the first num_data
#return the projection matrix, the variance and the mean
return V,S,mean_X
我知道我需要展平我的形象,但形状是512x512x3。 3的尺寸会甩掉我的结果吗?我如何截断这个? 如何找到保留多少信息的定量数量?
答案 0 :(得分:5)
如果有三个波段(RGB图像就是这种情况),则需要像
那样重塑图像X = X.reshape(-1, 3)
对于512x512图片,新X
的形状为(262144, 3)
。维度3不会甩掉你的结果;该维度表示图像数据空间中的要素。 X
的每一行都是一个样本/观察,每列代表一个变量/特征。
图像中的总方差等于np.sum(S)
,这是特征值的总和。您保留的方差量取决于您保留的特征值/特征向量。因此,如果您只保留第一个特征值/特征向量,那么您保留的图像方差的分数将等于
f = S[0] / np.sum(S)