标签: python machine-learning nlp gensim word2vec
我的数据中有doc2vec模型构建,现在我在运行时有一个新句子,它不属于经过训练的数据集。
doc2vec
如何从我的模型构建或预测该句子的向量?
我该如何处理这句话中的未知单词?
答案 0 :(得分:4)
Gensim(开发版)似乎有一种推断新句子向量的方法。查看https://github.com/gojomo/gensim/blob/develop/gensim/models/doc2vec.py
model.infer_vector(NewDocument)