机器学习使用R

时间:2017-12-28 11:03:43

标签: r machine-learning text-mining modeling text-classification

我在R中构建机器学习文本分类模型。如果它分为多个类别,我想将该句子分类为多个标签。

例如:"手机屏幕分辨率非常棒,电池续航时间也很长。" - 目前我可以将句子分类为电池或电话功能类别,但我希望将其分类为两者。

输出可以是: enter image description here

如果有人能帮助我获得上述结果的想法或方法,那将是很棒的。

1 个答案:

答案 0 :(得分:1)

我建议为每个标签训练一个二元分类器。

使用一些算法 - 比如逻辑回归 - 你所能做的就是独立训练每个二元分类器。

还有所谓的多标记算法 - 它们同时训练所有二元分类器,并从每个分类器的数据中提取相同的特征。一个例子是具有sigmoid最后一层的神经网络。有关多标记算法的列表,请参阅http://scikit-learn.org/stable/modules/multiclass.html中的“支持多标记”部分。

当然,多标签算法不一定会超越逻辑回归,你必须尝试看看什么最适合你的问题。