Keras 2 API 文档 / 层 API / 循环层 / ConvLSTM2D 层

ConvLSTM2D 层

[源代码]

ConvLSTM2D

tf_keras.layers.ConvLSTM2D(
    filters,
    kernel_size,
    strides=(1, 1),
    padding="valid",
    data_format=None,
    dilation_rate=(1, 1),
    activation="tanh",
    recurrent_activation="hard_sigmoid",
    use_bias=True,
    kernel_initializer="glorot_uniform",
    recurrent_initializer="orthogonal",
    bias_initializer="zeros",
    unit_forget_bias=True,
    kernel_regularizer=None,
    recurrent_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    recurrent_constraint=None,
    bias_constraint=None,
    return_sequences=False,
    return_state=False,
    go_backwards=False,
    stateful=False,
    dropout=0.0,
    recurrent_dropout=0.0,
    **kwargs
)

二维卷积 LSTM。

类似于 LSTM 层,但输入变换和循环变换都是卷积。

参数

  • filters: 整数,输出空间的维度(即卷积的输出滤波器数量)。
  • kernel_size: 整数或 n 个整数的元组/列表,指定卷积窗口的维度。
  • strides: 整数或 n 个整数的元组/列表,指定卷积的步长。指定任何步长值 != 1 与指定任何 dilation_rate 值 != 1 不兼容。
  • padding: "valid""same" 之一(不区分大小写)。"valid" 表示不填充。"same" 会导致在输入的左侧/右侧或上下均匀填充,以便输出具有与输入相同的宽/高维度。
  • data_format: 字符串,channels_last(默认)或 channels_first 之一。输入中维度的顺序。channels_last 对应于形状为 (batch, time, ..., channels) 的输入,而 channels_first 对应于形状为 (batch, time, channels, ...) 的输入。如果未指定,则使用 TF-Keras 配置文件 ~/.keras/keras.json(如果存在)中找到的 image_data_format 值,否则为 'channels_last'。默认为 'channels_last'。
  • dilation_rate: 整数或 n 个整数的元组/列表,指定用于扩张卷积的扩张率。目前,指定任何 dilation_rate 值 != 1 与指定任何 strides 值 != 1 不兼容。
  • activation: 要使用的激活函数。默认情况下应用双曲正切激活函数 (tanh(x))。
  • recurrent_activation: 用于循环步骤的激活函数。
  • use_bias: 布尔值,指示层是否使用偏置向量。
  • kernel_initializer: 用于输入线性变换的 kernel 权重矩阵的初始化器。
  • recurrent_initializer: 用于循环状态线性变换的 recurrent_kernel 权重矩阵的初始化器。
  • bias_initializer: 偏置向量的初始化器。
  • unit_forget_bias: 布尔值。如果为 True,则在初始化时将 1 添加到遗忘门的偏置。与 bias_initializer="zeros" 结合使用。这在 Jozefowicz 等人,2015 中推荐。
  • kernel_regularizer: 应用于 kernel 权重矩阵的正则化函数。
  • recurrent_regularizer: 应用于 recurrent_kernel 权重矩阵的正则化函数。
  • bias_regularizer: 应用于偏置向量的正则化函数。
  • activity_regularizer: 应用于的正则化函数。
  • kernel_constraint: 应用于 kernel 权重矩阵的约束函数。
  • recurrent_constraint: 应用于 recurrent_kernel 权重矩阵的约束函数。
  • bias_constraint: 应用于偏置向量的约束函数。
  • return_sequences: 布尔值。是否返回输出序列中的最后一个输出,或返回完整的序列。(默认值:False)
  • return_state: 布尔值。是否除了输出外还返回最后一个状态。(默认值:False)
  • go_backwards: 布尔值(默认值:False)。如果为 True,则反向处理输入序列。
  • stateful: 布尔值(默认值:False)。如果为 True,则批次中索引 i 处的每个样本的最后一个状态将用作后续批次中索引 i 处的样本的初始状态。
  • dropout: 0 到 1 之间的小数。输入线性变换中要丢弃的单元的分数。
  • recurrent_dropout: 0 到 1 之间的小数。循环状态线性变换中要丢弃的单元的分数。

调用参数

  • inputs: 5D 张量。
  • mask: 形状为 (samples, timesteps) 的二元张量,指示是否应该屏蔽给定的时间步长。
  • training: Python 布尔值,指示层应该以训练模式还是推理模式运行。调用单元时会将此参数传递给单元。仅当设置了 dropoutrecurrent_dropout 时才相关。
  • initial_state: 要传递到单元第一次调用的初始状态张量列表。

输入形状 - 如果 data_format='channels_first'

5D 张量,形状为:(samples, time, channels, rows, cols) - 如果 data_format='channels_last' 5D 张量,形状为:(samples, time, rows, cols, channels)

输出形状

  • 如果 return_state:张量列表。第一个张量是输出。其余张量是最后一个状态,每个 4D 张量形状为:如果 data_format='channels_first' 则为 (samples, filters, new_rows, new_cols),如果 data_format='channels_last' 则为 (samples, new_rows, new_cols, filters)rowscols 值可能由于填充而发生变化。
  • 如果 return_sequences:5D 张量,形状为:如果 data_format='channels_first' 则为 (samples, timesteps, filters, new_rows, new_cols),如果 data_format='channels_last' 则为 (samples, timesteps, new_rows, new_cols, filters)
  • 否则,4D 张量,形状为:如果 data_format='channels_first' 则为 (samples, filters, new_rows, new_cols),如果 data_format='channels_last' 则为 (samples, new_rows, new_cols, filters)

引发

  • ValueError: 如果构造函数参数无效。

参考文献