我有一个对我来说非常执着的问题。 我可以训练带有标记数据集的神经网络(即:带有目标信息的数据集),然后应用另一个没有标签的数据集吗?
我想用我的示例训练网络,但是在实际情况下希望它对示例进行分类(没有目标关联)。例如:
训练集:
Var1 Var2 Var3 Var4 Target
1 2 3 1 blue
测试集(没有目标,实际上这就是我想知道的)
Var1 Var2 Var3 Var4
1 2 3 1
假设预测必须是蓝色的。
我正在使用快速矿工测试神经网络,但我很快就明白我无法应用此测试集,因为它错过了标签。
我如何解决我的问题呢? 我想知道是否需要探索这个问题的无监督神经网络,但老实说我不这么认为。
亲切的问候。答案 0 :(得分:1)
对于有监督的学习,您可以使用标记的训练集来训练您拥有的任何模型。 然后,您可以使用该模型预测未标记集的标签。
如果您碰巧也有测试集的标签,您可以将预测值与测试集标签进行比较。 这样您就可以评估预测误差(即测试模型,因此测试名称 - 测试集)
如果您只对预测感兴趣,那么您绝对不需要标签。
答案 1 :(得分:1)
在没有标签的数据集上应用分类器(包括类似mlp的nn)是分类器的实际用途。
但是,当您说test
时,您的意思是希望看到false alarm rate
或precision
等质量指标,并且您需要使用标签来执行此操作。
假设您想训练分类器然后在实际情况下使用它,我强烈建议您先使用标记数据测试,然后尝试使用最理想精度的模型。否则你可能会有大量的错误预测,这当然会打扰你。
如果您只有一个带有少量样本的标签数据集,则可以尝试k-fold
验证。