Question

我正在训练逻辑回归算法，它会为每次迭代返回以下信息。我正在将这些实体收集为整个分类的数组。

你能告诉我一些可视化的方法吗？例如，绘制损失与准确度是否合适？或者我应该使用什么样的图形类型？

***** Iteration #74 *****
Loss: 170.07
Feature L2-norm: 12.5714
Learning rate (eta): 0.00778819
Total number of feature updates: 236800
Loss variance: 5.01839
Seconds required for this iteration: 0.01
Accuracy: 0.9800 (784/800)
Micro P, R, F1: 0.9771 (384/393), 0.9821 (384/391), 0.9796

***** Iteration #75 *****
Loss: 166.81
Feature L2-norm: 12.4385
Learning rate (eta): 0.00769234
Total number of feature updates: 240000
Loss variance: 4.68113
Seconds required for this iteration: 0.01
Accuracy: 0.9800 (784/800)
Micro P, R, F1: 0.9771 (384/393), 0.9821 (384/391), 0.9796

Answer 1

对于您自己的分析，您应该绘制精确度与时间的关系，以便了解何时开始过度拟合。
要发布，您可以选择其他人报告的指标，以便与之进行比较。

Answer 2

我不认为你应该想象这些信息。所有你能看到的是L2范数随着时间的推移而降低（因为它是目标最小化函数）并且准确度增加了。但由于F1如此之高，我认为这是评估训练数据的指标。所以我建议做Micro P，R，F1：0.9771（384/393），0.9821（384/391），0.9796这样的测试数据报告（数据不用于训练）并创建迭代对F1的图。然后，您将看到实际开始在图上按峰值过度拟合数据的时间。

如何可视化这类信息

2 个答案: