使用嵌入投影仪可视化Word2Vec模型

时间:2018-04-26 08:32:17

标签: tensorflow nlp data-visualization word2vec gensim

使用TensorFlow的嵌入投影仪可视化Word2Vec模型的最佳方法是什么? 有没有办法将Word2Vec模型的向量导出为Embedding Projector期望的格式?或者在张量流中是否有内置函数?

谢谢!

1 个答案:

答案 0 :(得分:0)

使用保存模型

model = Word2Vec(sentences)
model.wv.save_word2vec_format('model_name')

然后将模型转换为Embedding Projector所需的输入文件:

python -m gensim.scripts.word2vec2tensor --input model_name --output model_name

这将同时产生: model_name_tensor.tsv model_name_metadata.tsv

最后一个脚本是在PR中从您原始问题的注释中链接的问题中引入的。