应用错误收集

如何在sklearn中扩展tfidf矢量化器的单词，而无需从头开始重新训练整个模型？

时间：2018-03-06 15:36:55

标签： python machine-learning scikit-learn nlp tfidfvectorizer

我有一堆文本文档，我扔在一个tfidf矢量化器，我进一步用于多标签文本分类。我将来会继续获得更多文档。现在如何在不从头开始重新训练模型的情况下，将新单词添加到前所未见的矢量化器中？ partial_fit是唯一的选择，导致OvR和管道不兼容吗？以下是我正在谈论的链接online learning of text documents。

0 个答案:

没有答案

Sklearn TFIDF矢量化程序作为并行作业运行
Rails - 从头开始重新设计整个模型
sklearn：TFIDF Transformer：如何获取文档中给定单词的tf-idf值
如何分析sklearn中tfidf矩阵的值？
在不重新训练整个模型的情况下，向神经网络添加1个额外数据
Vectorizer是Python中单词的组合
矢量化fit_transform如何在sklearn中工作？
如何在sklearn中扩展tfidf矢量化器的单词，而无需从头开始重新训练整个模型？
如何从管道中的sklearn TFIDF矢量化器返回数据帧？
如何比较两个文本文件与tfidf矢量化器？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？