应用错误收集

我目前正在尝试训练Naive Bayes分类器，以帮助我对数据集进行分类。每个数据集都是由不同可能事件组成的日志。总共我有大约150个事件，我将其编码为日志属性，因此它显示了它们发生的频率。

总的来说，我有大约600个数据集 - 我使用400作为训练子集，其余200作为测试子集。

在创建模型并将其应用于测试子集时，会发生一些奇怪的事情：大多数测试数据集被归类为在训练数据集中以最小频率出现的那些类。大多数在训练数据中表现得非常好的课程根本不会显示为分类结果。不是你想要的，也不是正确的。

如果需要代码，我会稍后发布 - 但我认为这必须对Naive Bayes的工作方式以及我的数据结构方式做些什么。

感谢您的帮助！