朴素贝叶斯中不同特征的重要性

时间:2019-12-28 09:00:47

标签: python pandas naivebayes

我想知道朴素贝叶斯的前20个重要功能。我在目标功能中有两个类。通过探索stackoverflow中的其他形式,我找到了代码的参考代码。 代码:

neg_class_prob_sorted = multi_nb_best_alpha_bow.feature_log_prob_[0, :].argsort()
pos_class_prob_sorted = multi_nb_best_alpha_bow.feature_log_prob_[1, :].argsort()

print(np.take(multi_nb_best_alpha_bow_vec.get_feature_names(), neg_class_prob_sorted[-20:]))
print(np.take(multi_nb_best_alpha_bow_vec.get_feature_names(), pos_class_prob_sorted[-20:]))

有人能提供我关于每个班级的概率重要性为何不同的直觉吗? 如果我们需要选择前20个左右的功能来对测试集进行预测? 感谢您的帮助

0 个答案:

没有答案