我在R中构建机器学习文本分类模型。如果它分为多个类别,我想将该句子分类为多个标签。
例如:"手机屏幕分辨率非常棒,电池续航时间也很长。" - 目前我可以将句子分类为电池或电话功能类别,但我希望将其分类为两者。如果有人能帮助我获得上述结果的想法或方法,那将是很棒的。
答案 0 :(得分:1)
我建议为每个标签训练一个二元分类器。
使用一些算法 - 比如逻辑回归 - 你所能做的就是独立训练每个二元分类器。
还有所谓的多标记算法 - 它们同时训练所有二元分类器,并从每个分类器的数据中提取相同的特征。一个例子是具有sigmoid最后一层的神经网络。有关多标记算法的列表,请参阅http://scikit-learn.org/stable/modules/multiclass.html中的“支持多标记”部分。
当然,多标签算法不一定会超越逻辑回归,你必须尝试看看什么最适合你的问题。