[Python] sklearn天真的贝叶斯

时间:2017-08-14 03:47:17

标签: python naivebayes

I write python code like this


train_x, test_x, train_y, test_y = train_test_split(x, y, random_state=33, train_size=0.7)

#lsvc=LinearSVC()
#lsvc.fit(train_x, train_y)
#y_predict=lsvc.predict(train_x)
#print('The Accuracy of linear SVC is', lsvc.score(test_x, test_y))
cv = StratifiedKFold(y, n_folds=6)  
#classifier = svm.SVC(C=1, kernel='rbf',probability=True, gamma=0.8, random_state=random_state)#注意这里,probability=True,需要,不然预测的时候会出现异常。另外rbf核效果更好些。
mean_tpr = 0.0  
mean_fpr = np.linspace(0, 1, 100)  
all_tpr = []  
for i, (train, test) in enumerate(cv):  

    mnb.fit(np.matrix(x[train]), np.asarray(y[train],dtype="int64"))
    y_predict = predict(x[test])
    print(type(probas_))$

报告错误:     回溯(最近一次调用最后一次):

  File "<ipython-input-2-0d8cec505c57>", line 1, in <module>
    runfile('D:/我的文档/数据/实际工作技术文件/NB/nb.py', wdir='D:/我的文档/数据/实际工作技术文件/NB')

  File "C:\ProgramData\Anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", line 880, in runfile
    execfile(filename, namespace)

  File "C:\ProgramData\Anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", line 102, in execfile
    exec(compile(f.read(), filename, 'exec'), namespace)

  File "D:/我的文档/数据/实际工作技术文件/NB/nb.py", line 93, in <module>
    mnb.fit(np.matrix(x[train]), np.asarray(y[train],dtype="int64"))

  File "C:\ProgramData\Anaconda3\lib\site-packages\sklearn\naive_bayes.py", line 587, in fit
    self._count(X, Y)

  File "C:\ProgramData\Anaconda3\lib\site-packages\sklearn\naive_bayes.py", line 689, in _count
    if np.any((X.data if issparse(X) else X) < 0):

TypeError: '<' not supported between instances of 'numpy.ndarray' and 'int'

这是sklearn的朴素贝叶斯的召唤。包。数据类型有一些不匹配的问题,但我不知道修复它。任何人都可以提供帮助吗?它看起来像类型不匹配,但是,我该如何修复它?谢谢&amp;此致

1 个答案:

答案 0 :(得分:0)

问题可能是你的dtype论点。你可以改用np.asarray(y[train], dtype=np.int64)吗?您也可以让numpy推断数据类型并完全省略该参数。