如何从Glove预训练的单词嵌入查询?

时间:2017-05-19 01:49:29

标签: python word2vec

在Python中查询预先训练过的Glove(或类似的)Word嵌入的推荐方法是什么?

我能想到的一个选择是:

  1. Glove Page
  2. 下载整个预训练的单词嵌入向量
  3. 将它们放入Python词典
  4. 逐个嵌入单词。 (即从Python字典中检索值)
  5. 上述方法存在的问题是,需要首先将整个数据复制到磁盘,然后需要将2 Gigs数据加载到RAM ,这两者都可以太贵了

    这是标准方式吗? 就像从在线引擎查询一样? 还是其他方式?

1 个答案:

答案 0 :(得分:0)

您可以做的一件事就是只抓取测试/培训语料库中出现的单词并单独保存。这样您就不必在预先训练的矢量中加载所有其他单词(3百万)。