如何在时间“t”定义输入多输出的RNN-LSTM神经网络?

时间:2018-03-13 14:05:45

标签: deep-learning lstm rnn

我正在尝试构建一个RNN来预测一名球员参加比赛的可能性以及球员的得分和门票。我会使用LSTM,这样当前比赛的表现会影响球员未来的选择。

  

架构摘要:

输入功能:比赛详情 - 场地,参赛队伍,团队击球第一

输入样本:两队的球员名单。

输出:

  1. 离散:二进制:玩家是否玩过。
  2. Discrete:Wickets take。
  3. 续:运行得分。
  4. 连续:球被击打。
  5.   

    问题:

    1. 大多数情况下,RNN在最后一层使用“Softmax”或“MSE”来处理来自LSTM的“a” - 仅提供单个变量“Y”作为输出。但这里有四个因变量(2个离散变量和2个连续变量)。是否可以将所有四个作为输出变量拼接在一起?
    2. 如果是,我们如何处理具有损失函数的连续和离散输出的混合?
    3. (虽然LSTM“a”的输出具有多个功能并将信息传送到下一个时段,但我们需要输出的多个功能,以便根据真实情况进行训练)

1 个答案:

答案 0 :(得分:0)

你就是这样做的。如果没有关于使用的软件(如果有的话)的更多细节,很难提供更多的detasmail

LSTM单元的输出每次都是网络隐藏层的步骤

然后,您可以将其输入到4个输出图层。

1个sigmoid 2这是我发现的事情。也许4x sigmoid(4个wickets到一个天堂对吗?)或relu4 3,4线性(squarijng它是lso一个选项,e或relu)

出于培训目的,您的损失函数是您的4个人损失的总和。 因为它们都是MSE,所以你可以在计算损失之前将4个输出连接起来。

但是,第一个是交叉熵(对于sigmoid的决定),你需要单独计算和求和。 在得到输出向量

之后,您仍然可以将它们连接起来