让我更清楚地说明问题:
我正在使用python gensim.models.Word2Vec
来训练单词嵌入模型。根据我的理解,模型训练本质上是一个机器学习问题---通过预测任务训练神经网络。例如,如果我选择参数来训练跳过 - 克模型,则通过预测来自目标词的上下文词来训练模型。一旦模型训练有素,就可以从模型中获得单词向量。
如果我的理解是正确的,那么因为实际上它是一个机器学习过程而且训练目标是在预测任务中表现良好,所以在训练期间应该有一个损失函数,并且该模型应该将损失作为尽可能低。那么,如何知道给定参数集的模型损失值?或者我们可以知道了解模型本身的任何其他指标?
希望我的问题清楚明了。总之,我不想要按照Google测试集http://word2vec.googlecode.com/svn/trunk/questions-words.txt中的输出来评估模型,但我想将模型本身理解为简单的机器学习培训过程中遇到的问题。这可能吗?