标签: python machine-learning scikit-learn
我尝试使用单词或字符n-gram判别功能对文本进行分类,这意味着功能在一个类中至少出现90%。我正在尝试使用sklearn,但我找不到如何实现它。
我正在查看来自sklearn的CountVectorizer / TfidfVectorizer,但我找不到如何按类指定特征选择。
您能否建议一种如何实施此任务的方法?