一个gensim.models.Word2Vec
类具有方法predict_output_word()
。现在,我使用预先学习的模型,但是将其保存在类gensim.models.KeyedVectors
中。有一个类的模拟方法吗?或者如何从gensim.models.KeyedVectors中获取number_sets = 2
for dataset in range(number_sets):
dict_name = ''.join(['dataset_', str(dataset+1)])
globals() [dict_name] = {}
print(dataset_1)
print(dataset_2)
的实例?
我对gensim.models.Word2Vec
有所了解。
答案 0 :(得分:0)
KeyedVectors
实例只是单词和向量本身,不是完整模型,包括对于训练很重要的内部权重(以及训练过程中做出的内部预测)。
因此,KeyedVectors
对象缺少进行预测所需的状态,因此也缺少方法。 (还要注意,该方法的运行成本相对较高,仅适用于负采样模型,并且所得到的结果加权后的结果与训练过程中内部进行的“稀疏”半预测的加权结果完全相同。Word2Vec的意义在于”真正准确的邻居预测,但是使用这种预测尝试来引导具有其他有用属性的向量排列。
如果您要自己训练单词,那么以后需要完整模型功能时,应该保存完整模型。