嘈杂数据的学习曲线

时间:2013-06-19 14:19:12

标签: machine-learning supervised-learning

我正在对小文本进行监督分类,数据非常嘈杂。我绘制了一条学习曲线:x轴是#examples。 y轴是F-measure的值。曲线下降:我使用的实例越多,F测量分数越低。嘈杂的数据是典型的吗?或者这种行为有其他原因吗?

1 个答案:

答案 0 :(得分:1)

您是否使用训练集或测试集来计算F-measure?

如果你使用训练集计算它,那么下降学习曲线是很正常的。

如果你使用测试集计算它,那么可能有很多原因,最可能的是训练和测试集不是iid。