应用错误收集

在Spark中使用朴素贝叶斯分类时，是否可以为特征设置权重？

时间：2019-01-10 07:35:04

标签： java apache-spark classification apache-spark-mllib naivebayes

在我的Spark应用程序中，我使用NaiveBayesModel进行文本文档分类。假设我的模型如下：

class SomeDocument {
    String text;
    String lead;
}

我目前的方法是将包括text和lead在内的整个文档标记化，并将每个标记视为特征。这没有遵循业务规则，业务规则在分类中比lead更重要。换句话说，我需要为令牌设置权重，权重值必须取决于来源（text的{{1}}）。

我使用方法lead训练模型。

问题：如何设置特征的权重？

0 个答案:

没有答案