在Glove Implementation中读取词汇表文件

时间:2017-08-07 08:15:20

标签: python stanford-nlp word-embedding

我已按照此代码https://github.com/hans/glove.py为BBCNews数据集实施了手套模型 我已经形成了单个文件的语料库,单词之间有单个空格。生成词汇文件。你能解释一下如何阅读它吗?

Text corpus

vocabulary

1 个答案:

答案 0 :(得分:0)

词汇表文件应如下所示:

word1 word1_frequency
word1 word1_frequency

例如,

apple 102
are 10

等等。你确定你的模型训练正确吗?

资料来源:曾与GloVe合作