Python NaiveBayes:为什么我得到ZeroDivisionError

时间:2013-03-14 10:31:15

标签: python python-2.7 bayesian

我正在尝试NaiveBayes Python库(python 2.7)

我想知道为什么运行此代码会给我一个ZeroDivisionError

#!/usr/bin/env python
import NaiveBayes

model = NaiveBayes.NaiveBayes()

model.set_real(['Height'])
model.set_real(['Weight'])
model.add_instances({'attributes':
                         {'Height': 239,
                          'Weight': 231,
                          },
                     'cases': 32,
                     'label':  'Sex=M'})

model.add_instances({'attributes':
                         {'Height': 190,
                          'Weight': 152
                          },
                     'cases': 58,
                     'label': 'Sex=F'
                     })

model.train()
result = model.predict({'attributes': {'Height': 212, 'Weight': 200}})

print("The result is %s" % (result))

这是输出:

Traceback (most recent call last):
  File "/tmp/py4127eDT", line 24, in <module>
    result = model.predict({'attributes': {'Height': 212, 'Weight': 200}})
  File "/usr/local/lib/python2.7/dist-packages/NaiveBayes.py", line 152, in predict
    scores[label] /= sumPx
ZeroDivisionError: float division by zero

我是贝叶斯分类器的新手,所以我的输入有问题(即:数字的分布,还是没有足够的样本?)

1 个答案:

答案 0 :(得分:3)

有两个问题:

首先,你使用的是python 2.7,而NaiveBayes需要python 3.使用python 2时,它使用的除法转为整数除法并返回零。

其次,每个标签每个属性只有一个实例,因此sigma为零。

为您的真实属性添加更多变体:

import NaiveBayes

model = NaiveBayes.NaiveBayes()

model.set_real(['Height'])
model.set_real(['Weight'])
model.add_instances({'attributes':
                         {'Height': 239,
                          'Weight': 231,
                          },
                     'cases': 32,
                     'label':  'Sex=M'})

model.add_instances({'attributes':
                         {'Height': 233,
                          'Weight': 234,
                          },
                     'cases': 32,
                     'label':  'Sex=M'})
model.add_instances({'attributes':
                         {'Height': 190,
                          'Weight': 152
                          },
                     'cases': 58,
                     'label': 'Sex=F'
                     })
model.add_instances({'attributes':
                         {'Height': 191,
                          'Weight': 153
                          },
                     'cases': 58,
                     'label': 'Sex=F'
                     })

model.train()
result = model.predict({'attributes': {'Height': 212, 'Weight': 200}})

print ("The result is %s" % (result))

并使用python3:

$ python3 bayes.py
The result is {'Sex=M': 1.0, 'Sex=F': 0.0}