标签: python nlp
我(机器学习和自然语言处理中的完全菜鸟)正在使用doc2vec方法(gensim python库)来查找与随机字符串最相似的文档。问题是,每当我想向训练好的模型中添加新文档时,都需要从头开始重新训练模型。
是否有一种方法可以在无需训练的情况下将新文档/词汇添加到经过训练的模型中,或者能够更快地进行训练?
我对nlp的所有方法不知所措,只是从我发现最受欢迎的方法开始(word2vec / doc2vec),现在我正在寻找学习的方向。感谢您的任何建议。