标签: python machine-learning scikit-learn nlp tfidfvectorizer
我有一堆文本文档,我扔在一个tfidf矢量化器,我进一步用于多标签文本分类。我将来会继续获得更多文档。现在如何在不从头开始重新训练模型的情况下,将新单词添加到前所未见的矢量化器中? partial_fit是唯一的选择,导致OvR和管道不兼容吗? 以下是我正在谈论的链接online learning of text documents。