应用错误收集

机器学习使用R

时间：2017-12-28 11:03:43

标签： r machine-learning text-mining modeling text-classification

我在R中构建机器学习文本分类模型。如果它分为多个类别，我想将该句子分类为多个标签。

例如：＆＃34;手机屏幕分辨率非常棒，电池续航时间也很长。＆＃34; - 目前我可以将句子分类为电池或电话功能类别，但我希望将其分类为两者。

输出可以是：

如果有人能帮助我获得上述结果的想法或方法，那将是很棒的。

1 个答案:

答案 0 :(得分：1)

我建议为每个标签训练一个二元分类器。

使用一些算法 - 比如逻辑回归 - 你所能做的就是独立训练每个二元分类器。

还有所谓的多标记算法 - 它们同时训练所有二元分类器，并从每个分类器的数据中提取相同的特征。一个例子是具有sigmoid最后一层的神经网络。有关多标记算法的列表，请参阅http://scikit-learn.org/stable/modules/multiclass.html中的“支持多标记”部分。

当然，多标签算法不一定会超越逻辑回归，你必须尝试看看什么最适合你的问题。