从sklearn PCA结果中为python

时间:2017-06-24 21:22:32

标签: python matplotlib scikit-learn sklearn-pandas

我正在尝试使用PCA中的sklearn函数显示我使用二维创建的数据集的散点图。我的数据以以下方式返回:

array([[ -3.18592855e+04,  -2.13479310e+00],
       [ -3.29633003e+04,   1.40801796e+01],
       [ -3.25352942e+04,   7.36921088e+00],
...

我希望以下代码能够正常运行:

import pylab
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA

pca = PCA(n_components=2).fit(instances)
pca_2d = pca.transform(instances)

fig = plt.figure(figsize=(8,3))
plt.scatter(pca_2d[0],pca_2d[1])
plt.show()

但是这返回了一个不正确的数字,只显示前两个值。我需要更改什么才能启动并运行?

1 个答案:

答案 0 :(得分:2)

您提供了2个第一行而不是2列require(ggplot2) data <- read.table("test", sep = "\t", header = TRUE,) ggplot(data, aes(n, value)) + geom_point(aes(n,value)) + geom_line(aes(n,value)) dev.off() 来构建散点图。

执行:

pca_2d

好好补3分:

scatterplot