Question

在我使用的实现中，lstm以以下方式初始化：

l_lstm = Bidirectional(LSTM(64, return_sequences=True))(embedded_sequences)

我不是很了解，可能是因为一般缺乏Python经验：符号l_lstm= Bidirectional(LSTM(...))(embedded_sequences)。我不知道我将embedded_sequences传递给了什么？因为它不是LSTM()的参数，但似乎也不是Bidirectional()的参数，因为它是独立存在的。

以下是双向文档：

  def __init__(self, layer, merge_mode='concat', weights=None, **kwargs):
        if merge_mode not in ['sum', 'mul', 'ave', 'concat', None]:
            raise ValueError('Invalid merge mode. '
                             'Merge mode should be one of '
                             '{"sum", "mul", "ave", "concat", None}')
        self.forward_layer = copy.copy(layer)
        config = layer.get_config()
        config['go_backwards'] = not config['go_backwards']
        self.backward_layer = layer.__class__.from_config(config)
        self.forward_layer.name = 'forward_' + self.forward_layer.name
        self.backward_layer.name = 'backward_' + self.backward_layer.name
        self.merge_mode = merge_mode
        if weights:
            nw = len(weights)
            self.forward_layer.initial_weights = weights[:nw // 2]
            self.backward_layer.initial_weights = weights[nw // 2:]
        self.stateful = layer.stateful
        self.return_sequences = layer.return_sequences
        self.return_state = layer.return_state
        self.supports_masking = True
        self._trainable = True
        super(Bidirectional, self).__init__(layer, **kwargs)
        self.input_spec = layer.input_spec
        self._num_constants = None

Answer 1

让我们尝试分解正在发生的事情：

从LSTM(...)开始，它将创建一个LSTM Layer 。现在layers in Keras are callable，这意味着您可以像使用函数一样使用它们。例如，lstm = LSTM(...)然后lstm(some_input)将在给定的输入张量上调用 LSTM。
Bidirectional(...) 包装任何RNN层，并返回另一个层，该层在调用时会在两个方向上应用包装的层。因此，l_lstm = Bidirectional(LSTM(...))是一层，当使用某些输入进行调用时，将在两个方向上应用LSTM。 注意：双向创建传递的LSTM层的副本，因此向后和向前是不同的LSTM。
最后，当您调用Bidirectional(LSTM(...))(embedded_seqences)双向层时，将获取输入序列，并将其在两个方向上传递给包装的LSTM，收集它们的输出并将其连接起来。

要了解有关图层及其可调用性质的更多信息，请查看文档的functional API guide。

喀拉斯邦。初始化双向LSTM。传递单词嵌入

1 个答案: