使用判别特征进行文本分类

时间:2018-05-26 19:04:48

标签: python machine-learning scikit-learn

我尝试使用单词或字符n-gram判别功能对文本进行分类,这意味着功能在一个类中至少出现90%。我正在尝试使用sklearn,但我找不到如何实现它。

我正在查看来自sklearn的CountVectorizer / TfidfVectorizer,但我找不到如何按类指定特征选择。

您能否建议一种如何实施此任务的方法?

0 个答案:

没有答案