标签: python classification nltk text-classification
Ive文件采用元组格式(“主题”,“doc”): -
putchar(oneChar)
我只为分类任务采用了10个主题。
现在我的问题是,我如何将这10个主题之外的任何内容归类为“NA”(不是来自10个主题)?我现在正在使用Naive_bayes。还有其他分类器更适合“NA”主题吗?如果是,那么我们如何设置“NA”的阈值。