好吧,我写了这段代码来分类我的数据。我的数据包含5000个实例和260个功能。每个特征都是二项式的,即如果单词“money”在我正在分类的实例中,那么特征23是1,否则为0等。 有4个类别。当我计算最终类时,有57%的错误。在大多数情况下,对于所有c,期望概率P(y = c | x)为0。即使是正确的,这个值的最大值也是例如P(y = 1,x)= e ^ -80但其他的甚至更小,因此选择1级,这是真的。所以问题是我猜这些值太小了。我怎么解决这个问题?我已经看到使用对数概率可能更好,但我如何以对数方式实现?提前谢谢。
如果代码丢失或错误,我将代码作为附录。 labels =数据类,规范化要素=行是实例而列是要素的数据。 再次感谢。