如何使用`matplotlib`可视化5-D特征集和回归结果?

时间:2016-06-17 17:01:09

标签: numpy matplotlib scikit-learn data-visualization

我正在使用sklearn.svm支持向量回归来解决连续数据集上的回归问题,其中要素集具有 5维 1维 标签集,下面是数据集的外观:

>>> type(feature_set)
55: <type 'numpy.ndarray'>
>>> type(label_set)
56: <type 'numpy.ndarray'>
>>> feature_set.shape
57: (31875, 5)
>>> label_set.shape
58: (31875,)

现在我只想想象/绘制数据,我不知道该怎么做。 此外,功能集中有5个维度,但我们只能绘制两个维度,对吧?

这是我的回归者:

from sklearn.svm import SVR
reg = SVR()
count = int(len(feature_set)*0.8)
reg.fit(feature_set[:count], label_set[:count])

是否有可能可视化/绘制回归量的结果? 我对此非常陌生,因此可以使用任何或不同的技术,通过这些技术,我可以直观地显示连续数据(首选matplotlib)。 谢谢。

1 个答案:

答案 0 :(得分:1)

您应首先查看下面的scikit-learn示例,该示例演示了如何使用主成分分析和线性判别分析。如果没有将您的数据带到您想要的地方,您可以尝试使用计算更昂贵的歧管模块方法。

http://scikit-learn.org/stable/auto_examples/decomposition/plot_pca_vs_lda.html#example-decomposition-plot-pca-vs-lda-py

http://scikit-learn.org/stable/modules/manifold.html

编辑:在将数据传递给任何降维之前,最好先扩展数据。参见例如http://scikit-learn.org/stable/modules/preprocessing.html#preprocessing