如何预测KeyedVectors word2vec的输出单词?

时间:2019-03-25 15:23:22

标签: python python-3.x gensim word2vec

一个gensim.models.Word2Vec类具有方法predict_output_word()。现在,我使用预先学习的模型,但是将其保存在类gensim.models.KeyedVectors中。有一个类的模拟方法吗?或者如何从gensim.models.KeyedVectors中获取number_sets = 2 for dataset in range(number_sets): dict_name = ''.join(['dataset_', str(dataset+1)]) globals() [dict_name] = {} print(dataset_1) print(dataset_2) 的实例?

我对gensim.models.Word2Vec有所了解。

1 个答案:

答案 0 :(得分:0)

KeyedVectors实例只是单词和向量本身,不是完整模型,包括对于训练很重要的内部权重(以及训练过程中做出的内部预测)。

因此,KeyedVectors对象缺少进行预测所需的状态,因此也缺少方法。 (还要注意,该方法的运行成本相对较高,仅适用于负采样模型,并且所得到的结果加权后的结果与训练过程中内部进行的“稀疏”半预测的加权结果完全相同。Word2Vec的意义在于”真正准确的邻居预测,但是使用这种预测尝试来引导具有其他有用属性的向量排列。

如果您要自己训练单词,那么以后需要完整模型功能时,应该保存完整模型。