假设您使用C ++程序生成了GloVe个向量,并且“ -save-file”参数为“ vectors”。 Glove可执行文件将为您生成两个文件“ vectors.bin”和“ vectors.txt”。 [感谢@Ben好的formulation。]
我们可以使用Gensim的Gloves2word2vec将文本格式的GloVe矢量转换为word2vec文本格式。
但是,我想使用GloVe向量保持原样,但要使用标准化形式。我怎么知道默认情况下这些向量是否已归一化?如果不是,我该如何使用Python对其进行规范化(并再次获得正确的Glove模型)?