假设ANN已经使用长时间训练了1GB大小的训练数据。 当训练数据中的几行发生变化时,我们是否还需要再次训练数据? 或是ANN错误的设计?
答案 0 :(得分:2)
一般来说,答案是肯定的。这就是为什么......
首先,1GB的训练数据是一个相对测量,因为它没有给出训练样本数的指示。也许每个训练样本的大小都是1MB(可能是图像),只剩下大约1,000个可能不够的样本。
其次,了解神经网络的结构以解决完全再训练的问题是很重要的。如果您更新的训练集中的组件对应于可能在使用方面受到严重影响的节点,那么重新训练肯定是有序的。当然,反过来不一定是真的,因为可能不会立即明白神经网络的相互关联性如何受到输入变化的影响。
第三,神经网络意味着表示一种复杂的模式匹配器,经过训练以识别某些输入关系,并产生可能的输出关系。从这种天真的角度来看,输入的变化肯定应该与产出的变化相对应。这样,训练数据的变化可以非常好地对应于预期输出数据的变化。并且,即使它没有,输入模式也发生了变化,这可能意味着输出模式也发生了变化。
让我们考虑以下示例。假设您的神经网络经过培训,可以将绘画与艺术家相匹配,并且在制作the following match to Leonardo da Vinci时取得了成功:
现在它可以训练得很好,也可以断言下面的图像是"画的"由同一位艺术家:
这可能是因为你训练了你的神经网络在你最喜欢的气球和乐高小雕像的过去时间。但是,现在您的一些输入样本会发生变化,特别是那些与蒙娜丽莎相关的样本。相反,它们类似于你最喜欢的过去时间...徒手绘制鼠标:
尽管你说的是,但总的来说,上述图像的艺术性与之前的图像并不完全相符。因此,您的模式匹配器可能无法将此视为Leonardo da Vinci制作的艺术作品。因此,公平地说,对这类图像进行再培训应该是有序的。
您可能有很多选择:
根据训练数据的变化,测试重新训练神经网络的效果。这样您就可以自己回答这个问题,并对神经网络的架构有所了解。
仅根据更改重新调整神经网络,这些更改可被视为新训练数据。其价值可能在很大程度上取决于您的架构,样本的复杂程度以及培训数量(不是大小)。
进行全面的再培训并测试疗效。