我应该为多类逻辑回归分类器绘制多少条学习曲线?

时间:2015-07-20 00:04:16

标签: machine-learning classification data-analysis logistic-regression

如果我们有K班,我是否必须绘制K学习曲线? 因为我似乎不可能立刻计算出对所有K theta矢量的列车/验证误差。

为了澄清,学习曲线是训练和训练的曲线。交叉验证/测试集错误/成本与训练集大小。此图应该允许您查看增加训练集大小是否可以提高性能。更一般地说,学习曲线允许您识别您的算法是否存在偏差(在拟合下)或方差(过拟合)问题。

1 个答案:

答案 0 :(得分:0)

这取决于。学习曲线与课程数量无关。就像你说的那样,它是训练集和测试集错误的图,其中该错误是一个数值。这是所有学习曲线。

这个错误可以是你想要的任何东西:准确性,精确度,召回率,F1分数等(甚至MAE,MSE和其他用于回归)。

但是,您选择使用的错误是对您的特定问题有效或不适用的错误,这反过来会间接影响您应该如何使用学习曲线。

任何数量的类都可以很好地定义准确性,所以如果使用它,单个图就足够了。

然而,精确度和召回仅针对二元问题进行定义。您可以通过考虑每个类x的类not xx的二进制问题来对它们进行一些概括(请参阅here)。在这种情况下,您可能希望为每个类绘制学习曲线。这也有助于您更好地发现与某些课程相关的问题。

如果您想了解有关效果指标的更多信息,我非常喜欢this paper

相关问题