我有关于人工神经网络的培训和测试数据的问题。
测试数据是否应该通过特征提取过程才能进行分类? 我是这个领域的新手。我做得对吗? 我将数据集分成80%的列车和20%的测试。两套,我提取功能。对于列车数据我把它放入训练网络,但不是用于测试数据。然后去分类。它是否正确?因为我的SV说测试数据不应该通过特征提取过程。我想知道如果不提取具体特征,ANN如何识别输入。道歉我的英语不好。
如果有人有我可以参考的链接或期刊,请提供..
非常感谢。
答案 0 :(得分:0)
培训和测试数据都需要采用相同的格式 - 因此您的培训数据和测试数据应该经过相同的预处理步骤,否则您的网络将无法正确学习。
答案 1 :(得分:0)
你做得对(就我理解你的问题而言)。
示例:如果您要在纸上向我展示10张图像面孔(训练数据),然后仅按名称向我展示2人(训练数据)(不同的特征表示) - 我无法对我没学过的东西进行分类。您无法使用图像训练网络,然后使用音频或除用于训练的表示之外的任何其他表示进行测试。我无法将任何论文联系起来,因为这只是常识。
你可以修改训练集,例如通过添加噪音。但无论你做什么,表示格式必须相同。