如何评估Word2Vec的性能?

时间:2019-04-24 04:00:00

标签: nlp word2vec

我想知道一种评估word2Vec模型性能的有效方法,以便可以正确调整我的超参数。

例如,如果我要在监督学习下进行文档分类,则模型性能评估很容易,因为我可以将预测标签与测试数据集的预定义标签进行比较。

但是我不确定如何使用Word2Vec。谁能用代码解释如何做到这一点,或者提供指向执行此操作的页面的链接?

请不要在论文上添加链接...我真的很厌倦阅读困难的论文。

1 个答案:

答案 0 :(得分:1)

评估应始终取决于任务。因此,如果您想使用word2vec解决特定任务,则应评估该任务上的嵌入。

通常,有一些基准任务可用于更通用的单词表示评估,您可以尝试word-embeddings-benchmarks来探查针对包括语义相似性或情感分类在内的多个任务的嵌入。然后,您可以将自己的数字与效果更好的standard methods进行比较。如果您对句子层的表示属性(例如,整个句子的平均向量)更感兴趣,可以尝试SentEval