GloVe - 不均匀的编码向量

时间:2018-04-06 18:36:28

标签: python nlp word-embedding

我刚刚下载了glove.840B.300d.zip

并注意到并非所有元素都被编码为相同的矢量大小。特别是

path = '../path_to_glove/file.txt'
read_file = open(path, 'r', encoding="utf-8")
for i, el in enumerate(read_file):
    if len(el.split())>301:
        print(i)
        print(len(el.split()))

制备:

52343
303

这是一个错误还是我做错了什么?

0 个答案:

没有答案