NDCG评分器分类

时间:2018-11-15 23:00:26

标签: python scikit-learn classification data-science ranking

我正在解决根据利用率对每个唯一ID进行分类的问题。我在培训和测试数据中有6个独特的班级。我的神经网络模式预测了对应于每个类的利用率核心。因此,如果有10000个测试样本,则我有10000X6个预测数组和10000X6个真值数组。我想使用NDCG指标来验证模型性能。我正在跟踪随附的kaggle笔记本:https://www.kaggle.com/davidgasquez/ndcg-scorer

作者在此处指定的参数如下:

y_true : array, shape = [n_samples]
        Ground truth (true relevance labels).
y_score : array, shape = [n_samples, n_classes]
        Predicted scores.
k : int
        Rank.

在我的情况下,y_true是形状为n_samples X n_classes的数组,我的y_score也是如此。我不了解y_true的形状如何为n_samples,我在这里误解了吗? 我的排名也会是6吗? 感激之情。

0 个答案:

没有答案