如何使用NaiveBayes预测数据集

时间:2018-05-22 07:59:34

标签: machine-learning nltk predict naivebayes

x=dataset1[:,1:23] # features
y=dataset1[:,0] #classtypes 
xtrain, xtest, ytrain, ytest = train_test_split(x, y, test_size=0.20)

我的数据集只是字母。一行有23个字母。 第一个字母是classtype,其他字母是feauters。我有2个班 - > A,Z

示例:a,b,c,d,e,...,g

我会首先计算召回率,精确度和其他值。我需要找到ypred导致那些值要求2个参数(ytest,ypred)。 如何使用朴素贝叶斯预测数据?

2 个答案:

答案 0 :(得分:0)

我建议您查看朴素贝叶斯分类器的sklearn文档:here

答案 1 :(得分:0)

由于您说您使用的是nltk库,因此可以执行以下操作:

from nltk.classify import NaiveBayesClassifier
from nltk.classify.scikitlearn import SklearnClassifier

x=dataset1[:,1:23] # features
y=dataset1[:,0] #classtypes 
xtrain, xtest, ytrain, ytest = train_test_split(x, y, test_size=0.20)

classifier = NaiveBayesClassifier.train(xtrain)

y_predicted = classifier.classify(xtest)

此处,classify属性与predict算法中的scikit-learn属性相同。

可用属性如下: enter image description here

Documentation here