在Spark中使用朴素贝叶斯分类时,是否可以为特征设置权重?

时间:2019-01-10 07:35:04

标签: java apache-spark classification apache-spark-mllib naivebayes

在我的Spark应用程序中,我使用NaiveBayesModel进行文本文档分类。假设我的模型如下:

class SomeDocument {
    String text;
    String lead;
}

我目前的方法是将包括textlead在内的整个文档标记化,并将每个标记视为特征。这没有遵循业务规则,业务规则在分类中比lead更重要。换句话说,我需要为令牌设置权重,权重值必须取决于来源(text的{​​{1}})。

我使用方法lead训练模型。

问题:如何设置特征的权重?

0 个答案:

没有答案