我将在Keras使用LSTM。 我的训练样例是U1,U2,...,Uk,其维数为N * Tj,其中N是常数,Tj是Uj中每个样本的长度。 每个Uj都是Tj训练样本的任务。我打算将这些k任务提供给网络进行培训。该模型应该通过U1(通过反向传播学习它,批量大小不一定是T1),然后转到U2中的示例并学习它们,依此类推。一个时代在英国结束时完成。 Uj和U(j + 1)是两个不同的任务,网络不应该在训练期间将它们组合在一起。 (模型应该以某种方式理解每个任务的开始和结束,即,它不应该将下一个任务的元素视为上一个任务中序列的继续) 如何将此培训任务提供给网络?
答案 0 :(得分:0)
您的描述非常抽象,但我会尽力回答您的问题:
我猜Tj不应该每个样本更改。通常,所有样品具有相同的维度和形状。 这有点令人困惑,因为你说,样本的维数与样本量相同?
无论如何 - 您所谈论的真正问题是,您希望以特定顺序向网络提供样本,并且它应该解决多个任务。您正在寻找的研究术语是深度学习中的Multi-Task Learning
。
那些多任务神经网络可以在层次结构任务上很好地执行彼此非常相关。 如果您的任务差异很大,那么每个任务训练神经网络可能是最好的选择。