多类Logistic回归的学习曲线

时间:2015-05-30 19:17:54

标签: optimization machine-learning logistic-regression supervised-learning

我使用逻辑回归编写了一个多类分类器,使用一对一方法进行训练。我想绘制训练有素的分类器的学习曲线。

学习曲线是应该逐个类别地绘制还是应该是整个分类器的单个绘图?这有什么不同吗?

为了澄清,学习曲线是训练和训练的曲线。交叉验证/测试集错误/成本与训练集大小。此图应该允许您查看增加训练集大小是否可以提高性能。更一般地说,学习曲线允许您识别您的算法是否存在偏差(在拟合下)或方差(过拟合)问题。

有关我的代码的一些细节:

  • 分析MNIST手写数字图像
  • 预测图像中的数字(0-9)
  • 基于Andrew Ng关于机器学习的Coursera课程

1 个答案:

答案 0 :(得分:1)

一般来说,我会绘制所有的东西。或者写一个脚本来收集所有内容并将其全部绘制出来。

我认为对整个分类器情节的需求是显而易见的。但是,逐级课程让我觉得有价值,以确保你没有单一课程的问题。例如,如果“5”顽固地抵抗增加的训练数据,但整体分类器仍然受到它的帮助,我宁愿在我倾注更多数据之前调查那一类的情况。