神经网络嵌入在kNN分类器中的性能评估

时间:2016-02-05 07:54:44

标签: neural-network classification deep-learning knn representation

我正在解决分类问题。我为一组实体训练我的无监督神经网络(使用skip-gram架构)。

我评估的方法是为验证数据中的每个点,从训练数据搜索k个最近邻居。我采用最近邻居标签的加权和(基于距离的权重),并使用每个验证数据点的得分。

观察 - 当我增加纪元数(model1 - 600个纪元,model 2 - 1400个纪元和model 3 - 2000个纪元)时,我的AUC在较小的k值处得到改善,但在相似的值处饱和。

这种行为有什么可能的解释?

enter image description here

来自CrossValidated的

[Reposted

1 个答案:

答案 0 :(得分:0)

要交叉检查不平衡类是否存在问题,请尝试拟合SVM模型。如果这给出了更好的分类(如果您的ANN不是很深,则可能),可以得出结论,应首先平衡类。

另外,尝试一些内核函数来检查这种转换是否可以使数据线性分离?