我刚刚下载了glove.840B.300d.zip
并注意到并非所有元素都被编码为相同的矢量大小。特别是
path = '../path_to_glove/file.txt'
read_file = open(path, 'r', encoding="utf-8")
for i, el in enumerate(read_file):
if len(el.split())>301:
print(i)
print(len(el.split()))
制备:
52343
303
这是一个错误还是我做错了什么?