tensorflow - 使用numpy格式的预训练单词矢量模型时，如何将每个单词映射到wordvector？

当我使用numpy格式的单词矢量模型时，我想将每个单词映射到wordvector，我正尝试使用numpy格式的文件（text.model.npy）作为预训练的单词嵌入模型。

model = Word2Vec(sentences, size=300)  # Train pretrain_word model using gensim.
model.save('pretrain_word_embeding')

Fisrt，如何将gensim wordvec模型（pretrain_word_embeding）转换为numpy格式（text.model.npy）？

第二，当我使用如下代码加载单词嵌入模型时

embedding_path="text.model.npy"
embeddings = np.array(np.load(embedding_path),dtype='float32')
word_embeddings =tf.nn.embedding_lookup(params=embeddings,ids=word_ids)

我希望使用embedding_lookup，它可以将每个word_id与单词向量相对应，但是我知道numpy格式（text.model.npy）完全是数字矩阵吗？

使用numpy格式的预训练单词矢量模型时，如何将每个单词映射到wordvector？

0 个答案: