可以使用带有标签的训练集训练神经网络,并使用没有标签的数据集进行测试吗?

时间:2013-12-17 12:27:07

标签: neural-network rapidminer supervised-learning

我有一个对我来说非常执着的问题。 我可以训练带有标记数据集的神经网络(即:带有目标信息的数据集),然后应用另一个没有标签的数据集吗?

我想用我的示例训练网络,但是在实际情况下希望它对示例进行分类(没有目标关联)。例如:

训练集:

Var1  Var2  Var3  Var4  Target
1     2     3      1     blue

测试集(没有目标,实际上这就是我想知道的)

Var1  Var2  Var3  Var4  
 1     2     3      1     

假设预测必须是蓝色的。

我正在使用快速矿工测试神经网络,但我很快就明白我无法应用此测试集,因为它错过了标签。

我如何解决我的问题呢? 我想知道是否需要探索这个问题的无监督神经网络,但老实说我不这么认为。

亲切的问候。

2 个答案:

答案 0 :(得分:1)

对于有监督的学习,您可以使用标记的训练集来训练您拥有的任何模型。 然后,您可以使用该模型预测未标记集的标签。

如果您碰巧也有测试集的标签,您可以将预测值与测试集标签进行比较。 这样您就可以评估预测误差(即测试模型,因此测试名称 - 测试集)

如果您只对预测感兴趣,那么您绝对不需要标签。

答案 1 :(得分:1)

在没有标签的数据集上应用分类器(包括类似mlp的nn)是分类器的实际用途。 但是,当您说test时,您的意思是希望看到false alarm rateprecision等质量指标,并且您需要使用标签来执行此操作。

假设您想训练分类器然后在实际情况下使用它,我强烈建议您先使用标记数据测试,然后尝试使用最理想精度的模型。否则你可能会有大量的错误预测,这当然会打扰你。

如果您只有一个带有少量样本的标签数据集,则可以尝试k-fold验证。