我讨厌在没有包含代码和数据的自包含示例的情况下发布此内容,但我不能始终如一地重现我自己的问题而且我想知道是否有人可以提供帮助。
我正在尝试使用sklearn的GaussianNB
课程。在使用我的训练数据训练模型后,我试图查看分数并检索实际预测。但是,当我运行这些时,即使我没有在其间运行fit
,分数和预测也会不断变化。这大致是工作流程:
from sklearn.naive_bayes import GaussianNB
gnb = GaussianNB()
classified = gnb.fit(training_data_features,training_data_results)
classified.score(test_data_features,test_data_results)
classified.predict(test_data_features)
我做了致命的错误吗?我应该注意一个陷阱吗?
谢谢!
答案 0 :(得分:-1)
简而言之,不,得分和预测不合适。
http://scikit-learn.org/stable/modules/generated/sklearn.naive_bayes.GaussianNB.html
可能发生的事情是您的数据集太小或太近,并且您的大多数示例都位于两个高斯分布之间的中间的模糊区域中,因此当您运行测试数据时,有时它会落入一个分发和其他一些分配。
您使用的数据集是什么?