我正在尝试NaiveBayes
Python库(python 2.7)
我想知道为什么运行此代码会给我一个ZeroDivisionError
。
#!/usr/bin/env python
import NaiveBayes
model = NaiveBayes.NaiveBayes()
model.set_real(['Height'])
model.set_real(['Weight'])
model.add_instances({'attributes':
{'Height': 239,
'Weight': 231,
},
'cases': 32,
'label': 'Sex=M'})
model.add_instances({'attributes':
{'Height': 190,
'Weight': 152
},
'cases': 58,
'label': 'Sex=F'
})
model.train()
result = model.predict({'attributes': {'Height': 212, 'Weight': 200}})
print("The result is %s" % (result))
这是输出:
Traceback (most recent call last):
File "/tmp/py4127eDT", line 24, in <module>
result = model.predict({'attributes': {'Height': 212, 'Weight': 200}})
File "/usr/local/lib/python2.7/dist-packages/NaiveBayes.py", line 152, in predict
scores[label] /= sumPx
ZeroDivisionError: float division by zero
我是贝叶斯分类器的新手,所以我的输入有问题(即:数字的分布,还是没有足够的样本?)
答案 0 :(得分:3)
有两个问题:
首先,你使用的是python 2.7,而NaiveBayes需要python 3.使用python 2时,它使用的除法转为整数除法并返回零。
其次,每个标签每个属性只有一个实例,因此sigma为零。
为您的真实属性添加更多变体:
import NaiveBayes
model = NaiveBayes.NaiveBayes()
model.set_real(['Height'])
model.set_real(['Weight'])
model.add_instances({'attributes':
{'Height': 239,
'Weight': 231,
},
'cases': 32,
'label': 'Sex=M'})
model.add_instances({'attributes':
{'Height': 233,
'Weight': 234,
},
'cases': 32,
'label': 'Sex=M'})
model.add_instances({'attributes':
{'Height': 190,
'Weight': 152
},
'cases': 58,
'label': 'Sex=F'
})
model.add_instances({'attributes':
{'Height': 191,
'Weight': 153
},
'cases': 58,
'label': 'Sex=F'
})
model.train()
result = model.predict({'attributes': {'Height': 212, 'Weight': 200}})
print ("The result is %s" % (result))
并使用python3:
$ python3 bayes.py
The result is {'Sex=M': 1.0, 'Sex=F': 0.0}