如何可视化这类信息

时间:2011-10-23 21:48:55

标签: machine-learning

我正在训练逻辑回归算法,它会为每次迭代返回以下信息。我正在将这些实体收集为整个分类的数组。

你能告诉我一些可视化的方法吗?例如,绘制损失与准确度是否合适?或者我应该使用什么样的图形类型?

***** Iteration #74 *****
Loss: 170.07
Feature L2-norm: 12.5714
Learning rate (eta): 0.00778819
Total number of feature updates: 236800
Loss variance: 5.01839
Seconds required for this iteration: 0.01
Accuracy: 0.9800 (784/800)
Micro P, R, F1: 0.9771 (384/393), 0.9821 (384/391), 0.9796

***** Iteration #75 *****
Loss: 166.81
Feature L2-norm: 12.4385
Learning rate (eta): 0.00769234
Total number of feature updates: 240000
Loss variance: 4.68113
Seconds required for this iteration: 0.01
Accuracy: 0.9800 (784/800)
Micro P, R, F1: 0.9771 (384/393), 0.9821 (384/391), 0.9796

2 个答案:

答案 0 :(得分:0)

  1. 对于您自己的分析,您应该绘制精确度与时间的关系,以便了解何时开始过度拟合。
  2. 要发布,您可以选择其他人报告的指标,以便与之进行比较。

答案 1 :(得分:0)

我不认为你应该想象这些信息。所有你能看到的是L2范数随着时间的推移而降低(因为它是目标最小化函数)并且准确度增加了。但由于F1如此之高,我认为这是评估训练数据的指标。 所以我建议做Micro P,R,F1:0.9771(384/393),0.9821(384/391),0.9796这样的测试数据报告(数据不用于训练)并创建迭代对F1的图。然后,您将看到实际开始在图上按峰值过度拟合数据的时间。