sklearn.naive_bayes.GaussianNB中的ValueError

时间:2017-05-19 17:05:31

标签: python scikit-learn gaussian naivebayes

我开始学习机器学习。 所以我从Naive Bayes开始 我的python脚本

import numpy as np
x = np.array([[0,0],[1,1],[0,1],[1,0]])
y = np.array([0,0,1,1])
print(x)
from sklearn.naive_bayes import GaussianNB
clf = GaussianNB()
x = x.reshape(1,-1)
y = y.reshape(1,-1)
clf.fit(x,y)
a = clf.predict([[1,1]])
print(a)

我得到的错误是

[[0 0]
[1 1]
[0 1]
[1 0]]
Traceback (most recent call last):
  File "ex.py", line 9, in <module>
    clf.fit(x,y)
  File "/usr/local/lib/python2.7/dist-packages/sklearn/naive_bayes.py", line 182, in fit
    X, y = check_X_y(X, y)
  File "/usr/local/lib/python2.7/dist-packages/sklearn/utils/validation.py", line 526, in check_X_y
    y = column_or_1d(y, warn=True)
  File "/usr/local/lib/python2.7/dist-packages/sklearn/utils/validation.py", line 562, in column_or_1d
    raise ValueError("bad input shape {0}".format(shape))
ValueError: bad input shape (1, 4)

我该怎么办?

1 个答案:

答案 0 :(得分:0)

正如我在评论中所说,不需要重塑。您之前收到此错误(即,您提供的代码没有),因为您的代码在此之后正在运行。

考虑到您获得的部分始终为0作为预测,这是由于您的数据。 Naive Bayes需要更多的样本来分类,每个类的两个样本对于非线性问题是不够的。

import numpy as np
from sklearn.naive_bayes import GaussianNB

def GNB(x,y):
    clf = GaussianNB()
    clf.fit(x,y)
    a = clf.predict(x)
    print(a)

x = np.array([[0,0],[1,1],[0,1],[1,0]])
y = np.array([0,0,1,1])
GNB(x,y)
# Output : [0,0,0,0]

x = np.array([[0,0],[0,1],[1,1],[1,0],[3,4],[-2,2],[-3,2],[-4,-2]])
y = np.array([0,0,0,0,1,1,1,1])
GNB(x,y)
# [0 0 0 0 1 1 1 1]

看看我的两个例子。在第一种情况下(您提供的那种情况),NB不会成功分离数据。在第二个例子中(仍然是非线性的),NB成功返回正确的类,因为有足够数量的样本。

为了清晰起见,我创建了一个函数,但您可以在示例中添加更多示例,您将看到它的工作原理。 希望这有助于解决您的问题。