关于PCA的实施

时间:2018-01-18 02:50:59

标签: python

我正在使用sci-kit学习在python中实现PCA,它显示错误pca未找到。任何人都可以告诉如何解决这个问题。我写的代码如下,请检查。

谢谢。

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
from mpl_toolkits.mplot3d import Axes3D
from plyfile import PlyData, PlyElement
plt.style.use('ggplot')
reduce_factor = 100
 plyfile = PlyData.read('C:/Users/srinivas/data science with python/DAT210x-master/Module4/Datasets/stanford_armadillo.ply')
armadillo = pd.DataFrame({
'x':plyfile['vertex']['z'][::reduce_factor],  
'y':plyfile['vertex']['x'][::reduce_factor],
'z':plyfile['vertex']['y'][::reduce_factor]`

})

def do_PCA(armadillo, svd_solver):

import numpy as np
from sklearn.decomposition import PCA
pca = PCA(n_components=2,svd_solver='svd_solver')
pca.fit(armadillo)

 return armadillo 

%timeit pca = do_PCA(armadillo, 'full')


fig = plt.figure()
ax = fig.add_subplot(111)
ax.set_title('Full PCA')
ax.scatter(pca[:,0], pca[:,1], c='blue', marker='.', alpha=0.75)
plt.show()

1 个答案:

答案 0 :(得分:0)

您的变量pca仅存在于do_PCA方法的范围内。如果要在该方法外部使用它,则需要将其从方法中传出,或者创建一个类并将值存储在对象的状态中。

此外,do_PCA方法实际上从未被调用,因此永远不会创建它。