如何在Scikit中训练SGDC分类器时为功能赋予不同的权重?

时间:2016-02-08 05:21:56

标签: python python-2.7 scikit-learn

从文档中

class sklearn.linear_model.SGDClassifier(class_weight=None)

与class_weight函数一样,如何为我的功能集的特定方面赋予权重?就像我的功能集包含原始文本和一些名称。在培训期间,我希望对名称给予更多的重视,并减少原始文本的权重。我该怎么做?

1 个答案:

答案 0 :(得分:2)

没有选项可以为SGDClassifier中的要素赋予权重,而且据我所知,在其他学习者中并不知道scikit-learn。

通常,为特征赋予不同的权重是没有意义的。毕竟,您进行机器学习是因为您希望计算机找出哪些功能更重要。如果 name 原始文本更重要,分类器将在内部计算出来。

现在,如果您仍希望具有不同重要性的不同功能,则可以组合多个分类器: 仅使用名称功能训练一个分类器,并仅使用原始文本功能训练另一个分类器。然后通过获取每个分类器输出的加权平均值来组合它们的输出。您可以为 name - 分类器赋予更高的权重,这将增加 name 对组合输出的影响。