最好它应该是txt文件而不是二进制文件。我发现所有经过预先训练的单词嵌入都有300多个维度。
谢谢
答案 0 :(得分:0)
http://nlp.stanford.edu/data/glove.6B.zip 以GloVe格式下载此文件,并使用以下脚本将其转换为word2vec格式:https://github.com/jroakes/glove-to-word2vec
答案 1 :(得分:0)
可能的情况是,300维模型的任何50维仍然有用。因此,您可以想象在文本中使用300维集合,并修补文件以指定50维并丢弃每行的最后250个维度。