Keras 3 API 文档 / 层 API / 循环层 / ConvLSTM1D 层

ConvLSTM1D 层

[源代码]

ConvLSTM1D

keras.layers.ConvLSTM1D(
    filters,
    kernel_size,
    strides=1,
    padding="valid",
    data_format=None,
    dilation_rate=1,
    activation="tanh",
    recurrent_activation="sigmoid",
    use_bias=True,
    kernel_initializer="glorot_uniform",
    recurrent_initializer="orthogonal",
    bias_initializer="zeros",
    unit_forget_bias=True,
    kernel_regularizer=None,
    recurrent_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    recurrent_constraint=None,
    bias_constraint=None,
    dropout=0.0,
    recurrent_dropout=0.0,
    seed=None,
    return_sequences=False,
    return_state=False,
    go_backwards=False,
    stateful=False,
    **kwargs
)

一维卷积 LSTM。

类似于 LSTM 层,但输入变换和循环变换都是卷积的。

参数

  • filters: int,输出空间的维度(卷积中滤波器的数量)。
  • kernel_size: int 或 1 个整数的元组/列表,指定卷积窗口的大小。
  • strides: int 或 1 个整数的元组/列表,指定卷积的步幅长度。strides > 1dilation_rate > 1 不兼容。
  • padding: 字符串,"valid""same"(不区分大小写)。"valid" 表示无填充。"same" 会在输入的左/右或上/下均匀填充,使输出与输入具有相同的高度/宽度尺寸。
  • data_format: 字符串,可以是 "channels_last""channels_first"。输入中维度的顺序。"channels_last" 对应于形状为 (batch, steps, features) 的输入,而 "channels_first" 对应于形状为 (batch, features, steps) 的输入。它默认为在您的 Keras 配置文件 ~/.keras/keras.json 中找到的 image_data_format 值。如果您从未设置它,则它将为 "channels_last"
  • dilation_rate: int 或 1 个整数的元组/列表,指定用于空洞卷积的空洞率。
  • activation: 要使用的激活函数。默认情况下,应用双曲正切激活函数 (tanh(x))。
  • recurrent_activation: 用于循环步骤的激活函数。
  • use_bias: Boolean,该层是否使用偏置向量。
  • kernel_initializer: 用于 kernel 权重矩阵的初始化器,用于输入的线性变换。
  • recurrent_initializer: 用于 recurrent_kernel 权重矩阵的初始化器,用于循环状态的线性变换。
  • bias_initializer: 偏置向量的初始化器。
  • unit_forget_bias: Boolean。如果为 True,则在初始化时向遗忘门的偏置添加 1。与 bias_initializer="zeros" 结合使用。这是 Jozefowicz et al., 2015 中推荐的做法
  • kernel_regularizer: 应用于 kernel 权重矩阵的正则化函数。
  • recurrent_regularizer: 应用于 recurrent_kernel 权重矩阵的正则化函数。
  • bias_regularizer: 应用于偏置向量的正则化函数。
  • activity_regularizer: 应用于的正则化函数。
  • kernel_constraint: 应用于 kernel 权重矩阵的约束函数。
  • recurrent_constraint: 应用于 recurrent_kernel 权重矩阵的约束函数。
  • bias_constraint: 应用于偏置向量的约束函数。
  • dropout: 介于 0 和 1 之间的浮点数。输入线性变换中要丢弃的单元的比例。
  • recurrent_dropout: 介于 0 和 1 之间的浮点数。循环状态线性变换中要丢弃的单元的比例。
  • seed: dropout 的随机种子。
  • return_sequences: Boolean。是否返回输出序列中的最后一个输出,还是完整序列。默认值:False
  • return_state: Boolean。除了输出之外,是否返回最后一个状态。默认值:False
  • go_backwards: Boolean(默认值:False)。如果为 True,则反向处理输入序列并返回反转后的序列。
  • stateful: Boolean(默认值 False)。如果为 True,则批次中索引 i 处每个样本的最后一个状态将用作后续批次中索引 i 处样本的初始状态。
  • unroll: Boolean(默认值:False)。如果为 True,则网络将被展开,否则将使用符号循环。展开可以加速 RNN,尽管它往往更占用内存。展开仅适用于短序列。

调用参数

  • inputs: 一个 4D 张量。
  • initial_state: 要传递给单元格首次调用的初始状态张量列表。
  • mask: 形状为 (samples, timesteps) 的二元张量,指示是否应屏蔽给定的时间步。
  • training: Python 布尔值,指示层应在训练模式还是推理模式下运行。这仅在设置了 dropoutrecurrent_dropout 时相关。

输入形状

  • 如果 data_format="channels_first":形状为 (samples, time, channels, rows) 的 4D 张量
  • 如果 data_format="channels_last":形状为 (samples, time, rows, channels) 的 4D 张量

输出形状

  • 如果 return_state:张量列表。第一个张量是输出。其余张量是最后一个状态,每个都是 3D 张量,形状为:如果 data_format='channels_first' 则为 (samples, filters, new_rows),如果 data_format='channels_last' 则为 (samples, new_rows, filters)rows 值可能因填充而改变。
  • 如果 return_sequences:形状为 (samples, timesteps, filters, new_rows) 的 4D 张量,如果 data_format='channels_first',或者形状为 (samples, timesteps, new_rows, filters) 的 4D 张量,如果 data_format='channels_last'
  • 否则,形状为 (samples, filters, new_rows) 的 3D 张量,如果 data_format='channels_first',或者形状为 (samples, new_rows, filters) 的 3D 张量,如果 data_format='channels_last'

参考文献

  • Shi et al., 2015(当前的实现不包括单元格输出上的反馈循环)。