python - 如何从gensim的word2vec中提取词汇量向量？ - Thinbug

如何从gensim的word2vec中提取词汇量向量？

时间：2017-05-10 23:09:25

标签： python machine-learning gensim word2vec text-classification

我想分析寻找模式和东西的向量，并在它们上使用SVM来完成A类和B类之间的分类任务，任务应该受到监督。（我知道这可能听起来很奇怪，但这是我们的功课。）所以我真的需要知道：

1-如何使用训练模型提取文档的编码向量？

2-如何解释它们以及word2vec如何对它们进行编码？

我正在使用gensim的word2vec。

1 个答案:

答案 0 :(得分：1)

如果你已经训练了word2vec模型，你可以通过__getitem__方法得到单词向量

model = gensim.models.Word2Vec(sentences) print(model["some_word_from_dictionary"])
不幸的是，word2vec / doc2vec的嵌入不是由人解释的（与LdaModel的主题向量相反）

P / S如果你的任务中的对象有文本，那么你应该使用Doc2Vec模型