我想分析寻找模式和东西的向量,并在它们上使用SVM来完成A类和B类之间的分类任务,任务应该受到监督。 (我知道这可能听起来很奇怪,但这是我们的功课。)所以我真的需要知道:
1-如何使用训练模型提取文档的编码向量?
2-如何解释它们以及word2vec如何对它们进行编码?
我正在使用gensim的word2vec。
答案 0 :(得分:1)
如果你已经训练了word2vec模型,你可以通过__getitem__
方法得到单词向量
model = gensim.models.Word2Vec(sentences)
print(model["some_word_from_dictionary"])
不幸的是,word2vec / doc2vec的嵌入不是由人解释的(与LdaModel的主题向量相反)
P / S如果你的任务中的对象有文本,那么你应该使用Doc2Vec模型