使用numpy格式的预训练单词矢量模型时,如何将每个单词映射到wordvector?

时间:2019-01-23 07:26:12

标签: tensorflow

当我使用numpy格式的单词矢量模型时,我想将每个单词映射到wordvector,我正尝试使用numpy格式的文件(text.model.npy)作为预训练的单词嵌入模型。

model = Word2Vec(sentences, size=300)  # Train pretrain_word model using gensim.
model.save('pretrain_word_embeding')

Fisrt,如何将gensim wordvec模型(pretrain_word_embeding)转换为numpy格式(text.model.npy)?

第二,当我使用如下代码加载单词嵌入模型时

embedding_path="text.model.npy"
embeddings = np.array(np.load(embedding_path),dtype='float32')
word_embeddings =tf.nn.embedding_lookup(params=embeddings,ids=word_ids)

我希望使用embedding_lookup,它可以将每个word_id与单词向量相对应,但是我知道numpy格式(text.model.npy)完全是数字矩阵吗?

0 个答案:

没有答案