我正在使用Doc2Vec和Word2Vec深度学习算法(Doc2Vec API description from Gensim)。 More description here
目前我对使用model.n_similarity(wordSet1, wordSet2)
方法感兴趣,该方法基本上计算了两组词之间的余弦相似度。
我对验证模型性能的任何方法感兴趣,不仅仅是n_similiarity()
函数,还有整体模型提供的准确或真实结果。由于它执行深度学习,我不知道是否有任何方法可以知道它的表现如何。
我是否应该查找任何技术,然后使用或者是否存在具有结果的数据集,我应该进行比较?
非常感谢任何建议。谢谢。