如何在Gensim中以.npy扩展名加载经过预训练的fastText模型

时间:2020-08-28 15:59:06

标签: gensim pre-trained-model fasttext

我是深度学习的新手,我正在尝试使用paper中的预训练单词嵌入模型。我下载了以下文件:

1)sa-d300-m2-fasttext.model

2)sa-d300-m2-fasttext.model.trainables.syn1neg.npy

3)sa-d300-m2-fasttext.model.trainables.vectors_ngrams_lockf.npy

4)sa-d300-m2-fasttext.model.wv.vectors.npy

5)sa-d300-m2-fasttext.model.wv.vectors_ngrams.npy

6)sa-d300-m2-fasttext.model.wv.vectors_vocab.npy

如果需要这些详细信息 sa-梵语 d300-嵌入尺寸 fastText-fastText

我没有gensim的经验,如何将模型加载到gensim或张量流中。

我尝试过

from gensim.models.wrappers import FastText
FastText.load_fasttext_format('/content/sa/300/fasttext/sa-d300-m2-fasttext.model.wv.vectors_ngrams.npy')

FileNotFoundError:[错误2]没有这样的文件或目录:'/content/sa/300/fasttext/sa-d300-m2-fasttext.model.wv.vectors_ngrams.npy.bin'

1 个答案:

答案 0 :(得分:1)

这组多个文件看起来像是使用Gensim的save()方法从Gensim的FastText实现中保存的-因此在Facebook的原始“ fasttext_format”中不是

因此,请尝试使用以下内容加载它们:

from gensim.models.fasttext import FastText
model = FastText.load('/content/sa/300/fasttext/sa-d300-m2-fasttext.model')

(加载该主文件/根文件后,只要存在子目录相关文件,它们就会在同一目录中找到。)

下载这些文件的来源应包括清楚的说明,以便在附近加载它们!