我正在解决分类问题。我为一组实体训练我的无监督神经网络(使用skip-gram架构)。
我评估的方法是为验证数据中的每个点,从训练数据搜索k个最近邻居。我采用最近邻居标签的加权和(基于距离的权重),并使用每个验证数据点的得分。
观察 - 当我增加纪元数(model1
- 600个纪元,model 2
- 1400个纪元和model 3
- 2000个纪元)时,我的AUC在较小的k
值处得到改善,但在相似的值处饱和。
这种行为有什么可能的解释?
来自CrossValidated的答案 0 :(得分:0)
要交叉检查不平衡类是否存在问题,请尝试拟合SVM模型。如果这给出了更好的分类(如果您的ANN不是很深,则可能),可以得出结论,应首先平衡类。
另外,尝试一些内核函数来检查这种转换是否可以使数据线性分离?