Python中的朴素贝叶斯分类

时间:2016-11-04 06:44:48

标签: python nltk naivebayes

我对python很新。我已经使用

从csv文件中读取了所有数据
import csv
import nltk

f = open('C:/Users/Documents/Data/exp.csv')
csv_f = csv.reader(f)

dataset = []

for row in csv_f:
    dataset.append(row)

print (dataset)

现在,我想做nltk.NaiveBayesClassifier 我怎么能这样做?

1 个答案:

答案 0 :(得分:1)

例如,如果CSV的内容如下:

<强> CSV

Size,Color,Shape,Accept
small,blue,oval,yes
small,green,oval,yes
big,green,oval,no
big,red,square,no
small,red,square,no
small,blue,square,yes
big,red,circle,yes

我们想知道使用nltk Naive Bayes是否接受 小红色椭圆 项目,我们可以使用以下代码:

<强>蟒

import csv
import nltk

f = open('C:/Users/Amrit/Documents/Data/exp.csv')
csv_f = csv.reader(f)
csv_f.next()  #skip the header line

dataset = []

for row in csv_f:
    dataset.append(({'size': row[0], 'color': row[1], 'shape': row[2]}, row[3]))

print (dataset)

classifier = nltk.NaiveBayesClassifier.train(dataset)

mydata = {'size':'small', 'color':'red', 'shape':'oval'}
print (mydata, classifier.classify(mydata))

注意:我也在学习。感谢@Franscisco Couzo和@Milad M提供的链接