标签: python word2vec
在Python中查询预先训练过的Glove(或类似的)Word嵌入的推荐方法是什么?
我能想到的一个选择是:
上述方法存在的问题是,需要首先将整个数据复制到磁盘,然后需要将2 Gigs数据加载到RAM ,这两者都可以太贵了。
这是标准方式吗? 就像从在线引擎查询一样? 还是其他方式?
答案 0 :(得分:0)
您可以做的一件事就是只抓取测试/培训语料库中出现的单词并单独保存。这样您就不必在预先训练的矢量中加载所有其他单词(3百万)。