Keras 2 API 文档 / 层 API / 池化层 / MaxPooling1D 层

MaxPooling1D 层

[源代码]

MaxPooling1D

tf_keras.layers.MaxPooling1D(
    pool_size=2, strides=None, padding="valid", data_format="channels_last", **kwargs
)

一维时间序列数据的最大池化操作。

通过在大小为pool_size的空间窗口内取最大值来对输入表示进行下采样。窗口以strides为步长移动。当使用"valid"填充选项时,得到的输出形状为:output_shape = (input_shape - pool_size + 1) / strides)

当使用"same"填充选项时,得到的输出形状为:output_shape = input_shape / strides

例如,对于strides=1padding="valid"

>>> x = tf.constant([1., 2., 3., 4., 5.])
>>> x = tf.reshape(x, [1, 5, 1])
>>> max_pool_1d = tf.keras.layers.MaxPooling1D(pool_size=2,
...    strides=1, padding='valid')
>>> max_pool_1d(x)
<tf.Tensor: shape=(1, 4, 1), dtype=float32, numpy=
array([[[2.],
        [3.],
        [4.],
        [5.]]], dtype=float32)>

例如,对于strides=2padding="valid"

>>> x = tf.constant([1., 2., 3., 4., 5.])
>>> x = tf.reshape(x, [1, 5, 1])
>>> max_pool_1d = tf.keras.layers.MaxPooling1D(pool_size=2,
...    strides=2, padding='valid')
>>> max_pool_1d(x)
<tf.Tensor: shape=(1, 2, 1), dtype=float32, numpy=
array([[[2.],
        [4.]]], dtype=float32)>

例如,对于strides=1padding="same"

>>> x = tf.constant([1., 2., 3., 4., 5.])
>>> x = tf.reshape(x, [1, 5, 1])
>>> max_pool_1d = tf.keras.layers.MaxPooling1D(pool_size=2,
...    strides=1, padding='same')
>>> max_pool_1d(x)
<tf.Tensor: shape=(1, 5, 1), dtype=float32, numpy=
array([[[2.],
        [3.],
        [4.],
        [5.],
        [5.]]], dtype=float32)>

参数

  • pool_size:整数,最大池化窗口的大小。
  • strides:整数或 None。指定池化窗口每次池化移动的距离。如果为 None,则默认为pool_size
  • padding"valid""same"之一(不区分大小写)。"valid"表示不填充。"same"会导致在输入的左右或上下均匀填充,使得输出的高度/宽度维度与输入相同。
  • data_format:字符串,channels_last(默认)或channels_first之一。输入中维度的顺序。channels_last对应于形状为(batch, steps, features)的输入,而channels_first对应于形状为(batch, features, steps)的输入。

输入形状

  • 如果data_format='channels_last':形状为(batch_size, steps, features)的三维张量。
  • 如果data_format='channels_first':形状为(batch_size, features, steps)的三维张量。

输出形状

  • 如果data_format='channels_last':形状为(batch_size, downsampled_steps, features)的三维张量。
  • 如果data_format='channels_first':形状为(batch_size, features, downsampled_steps)的三维张量。