x=dataset1[:,1:23] # features
y=dataset1[:,0] #classtypes
xtrain, xtest, ytrain, ytest = train_test_split(x, y, test_size=0.20)
我的数据集只是字母。一行有23个字母。 第一个字母是classtype,其他字母是feauters。我有2个班 - > A,Z
示例:a,b,c,d,e,...,g
我会首先计算召回率,精确度和其他值。我需要找到ypred导致那些值要求2个参数(ytest,ypred)。 如何使用朴素贝叶斯预测数据?
答案 0 :(得分:0)
我建议您查看朴素贝叶斯分类器的sklearn
文档:here
答案 1 :(得分:0)
由于您说您使用的是nltk
库,因此可以执行以下操作:
from nltk.classify import NaiveBayesClassifier
from nltk.classify.scikitlearn import SklearnClassifier
x=dataset1[:,1:23] # features
y=dataset1[:,0] #classtypes
xtrain, xtest, ytrain, ytest = train_test_split(x, y, test_size=0.20)
classifier = NaiveBayesClassifier.train(xtrain)
y_predicted = classifier.classify(xtest)
classify
属性与predict
算法中的scikit-learn
属性相同。