Python Sklearn - 弃用警告

时间:2016-06-01 01:59:49

标签: python scikit-learn

我是Python和Sklearn的初学者。想知道我在这里是否遗漏了什么。我收到以下警告信息:

  

DeprecationWarning:传递1d数组作为数据在0.17中弃用   并在0.19中提出ValueError。

以下是代码:

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import SGDClassifier
from sklearn.datasets.samples_generator import make_blobs

def plot_sgd_separator():
    # we create 50 separable points
    X, Y = make_blobs(n_samples=50, centers=2,random_state=0, cluster_std=0.60)
    X = np.array(X).reshape((1, -1))


    # fit the model
    clf = SGDClassifier(loss="hinge", alpha=0.01,
                        n_iter=200, fit_intercept=True)
    clf.fit(X, Y)

    # plot the line, the points, and the nearest vectors to the plane
    xx = np.linspace(-1, 5, 10)
    yy = np.linspace(-1, 5, 10)

    X1, X2 = np.meshgrid(xx, yy)
    Z = np.empty(X1.shape)
    for (i, j), val in np.ndenumerate(X1):
        x1 = val
        x2 = X2[i, j]
        p = clf.decision_function([x1, x2])
        Z[i, j] = p[0]
    levels = [-1.0, 0.0, 1.0]
    linestyles = ['dashed', 'solid', 'dashed']
    colors = 'k'

    ax = plt.axes()
    ax.contour(X1, X2, Z, levels, colors=colors, linestyles=linestyles)
    ax.scatter(X[:, 0], X[:, 1], c=Y, cmap=plt.cm.Paired)

    ax.axis('tight')


if __name__ == '__main__':
    plot_sgd_separator()
    plt.show()

再次感谢您的关注。顺便说一句,我使用的是Python 3.5.1。

2 个答案:

答案 0 :(得分:1)

我猜您的问题已经回答here,这可能是重复

答案 1 :(得分:0)

如果您阅读了警告消息并进行了一些调试,您将意识到警告的产生是因为您对模型的输入是一维的。您可以看到此链接:Sklearn train model with single sample raises a DeprecationWarning以解决此问题。

我觉得您的代码存在其他问题。当我运行它时,我看到X和Y中的数据点数量不同。 X有100,Y有50,这是一个更严重的问题,我觉得这需要先纠正。