Question

x=dataset1[:,1:23] # features
y=dataset1[:,0] #classtypes 
xtrain, xtest, ytrain, ytest = train_test_split(x, y, test_size=0.20)

我的数据集只是字母。一行有23个字母。第一个字母是classtype，其他字母是feauters。我有2个班 - ＆gt; A，Z

示例：a，b，c，d，e，...，g

我会首先计算召回率，精确度和其他值。我需要找到ypred导致那些值要求2个参数（ytest，ypred）。如何使用朴素贝叶斯预测数据？

Answer 1

我建议您查看朴素贝叶斯分类器的sklearn文档：here

Answer 2

由于您说您使用的是nltk库，因此可以执行以下操作：

from nltk.classify import NaiveBayesClassifier
from nltk.classify.scikitlearn import SklearnClassifier

x=dataset1[:,1:23] # features
y=dataset1[:,0] #classtypes 
xtrain, xtest, ytrain, ytest = train_test_split(x, y, test_size=0.20)

classifier = NaiveBayesClassifier.train(xtrain)

y_predicted = classifier.classify(xtest)

此处，`classify`属性与`predict`算法中的`scikit-learn`属性相同。

可用属性如下：

Documentation here

如何使用NaiveBayes预测数据集

2 个答案:

此处，`classify`属性与`predict`算法中的`scikit-learn`属性相同。

如何使用NaiveBayes预测数据集

2 个答案:

此处，classify属性与predict算法中的scikit-learn属性相同。

此处，`classify`属性与`predict`算法中的`scikit-learn`属性相同。