对文档分类中的“不适用”类别进行分类

时间:2016-01-08 06:18:00

标签: python classification nltk text-classification

Ive文件采用元组格式(“主题”,“doc”): -

putchar(oneChar)

我只为分类任务采用了10个主题。

现在我的问题是,我如何将这10个主题之外的任何内容归类为“NA”(不是来自10个主题)?我现在正在使用Naive_bayes。还有其他分类器更适合“NA”主题吗?如果是,那么我们如何设置“NA”的阈值。

0 个答案:

没有答案