Question

它输出：

对于具有多于一层的GRU，我想知道如何获取最后一层的隐藏状态，应该是h_n[0]还是h_n[-1]？

如果是双向的，该如何切片以获取两个方向上GRU的最后一个隐藏层状态？

Answer 1

文档nn.GRU对此很清楚。这是一个使它更加明确的示例：

对于单向GRU / LSTM（具有多个隐藏层）：

output-将包含所有时间步长的所有输出功能t
h_n-将返回所有层的隐藏状态（在最后一个时间步）。

要获取最后一个隐藏层和最后一个时间步的隐藏状态，请使用：

first_hidden_layer_last_timestep = h_n[0]
last_hidden_layer_last_timestep = h_n[-1]

其中n是序列长度。

这是因为说明说：

num_layers –循环图层数。例如，设置num_layers=2意味着将两个GRU堆叠在一起以形成堆叠的GRU，而第二个GRU则接收第一个GRU的输出并计算最终结果。

因此，以相同的顺序相应地返回结果（即隐藏状态）是自然而直观的。