我正在使用StringToWordVector Naive Bayes和StringToWordVector来分类一些文本。 我也用TD / IDF对单词进行评分。
是否有一种简单的方法可以在训练期间增加某些单词(由我自己选择)的分数,以增加给定课程模型中这些单词的重量? 因此,如果新文档中存在这些单词,分类器就会知道该文档更有可能属于该类。
谢谢!
答案 0 :(得分:0)
您希望增加包含特定单词的文档被归类为某种文档的概率。
您可以做的是简单地使用包含这些单词的“手工制作”文档训练您的分类器,然后将这些文档标记为属于特定类。