我的任务如下:我有一个(黑盒子)方法,它计算从初始元素开始的序列。在每个步骤中,我的方法从外部内存源读取输入并输出可能会更改此内存的操作。您可以将此方法视为函数f: (external state, reading) -> action
。我想训练一个ANN学习f()
,这意味着我希望能够接受我训练过的模型,输入一个输入,得到预测的动作,用它来改变外部状态并无限期地重复这个过程,一步一步。
由于f()
的性质,我知道人工神经网络必须是经常性和有状态的,但我对其余部分不太确定。训练它将读数序列映射到动作序列是有意义的,但只有模型能够将每个读数与最后一步输出的动作融合在一起才有意义,而且我不确定如何强制执行。
但最重要的是:在训练我的模型后,给定的序列长度(读数^ N - >动作^ N),如何一次一步地输出预测(序列长度= 1)?这可能吗?