我正在使用sci-kit学习在python中实现PCA,它显示错误pca未找到。任何人都可以告诉如何解决这个问题。我写的代码如下,请检查。
谢谢。
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
from mpl_toolkits.mplot3d import Axes3D
from plyfile import PlyData, PlyElement
plt.style.use('ggplot')
reduce_factor = 100
plyfile = PlyData.read('C:/Users/srinivas/data science with python/DAT210x-master/Module4/Datasets/stanford_armadillo.ply')
armadillo = pd.DataFrame({
'x':plyfile['vertex']['z'][::reduce_factor],
'y':plyfile['vertex']['x'][::reduce_factor],
'z':plyfile['vertex']['y'][::reduce_factor]`
})
def do_PCA(armadillo, svd_solver):
import numpy as np
from sklearn.decomposition import PCA
pca = PCA(n_components=2,svd_solver='svd_solver')
pca.fit(armadillo)
return armadillo
%timeit pca = do_PCA(armadillo, 'full')
fig = plt.figure()
ax = fig.add_subplot(111)
ax.set_title('Full PCA')
ax.scatter(pca[:,0], pca[:,1], c='blue', marker='.', alpha=0.75)
plt.show()
答案 0 :(得分:0)
您的变量pca
仅存在于do_PCA
方法的范围内。如果要在该方法外部使用它,则需要将其从方法中传出,或者创建一个类并将值存储在对象的状态中。
此外,do_PCA
方法实际上从未被调用,因此永远不会创建它。