Keras 2 API 文档 / 层 API / 池化层 / 平均池化2D层

平均池化2D层

[源代码]

AveragePooling2D

tf_keras.layers.AveragePooling2D(
    pool_size=(2, 2), strides=None, padding="valid", data_format=None, **kwargs
)

用于空间数据的平均池化操作。

通过对输入窗口(大小由pool_size定义)内的每个通道取平均值,沿其空间维度(高度和宽度)对输入进行下采样。窗口沿每个维度移动strides

当使用"valid"填充选项时,生成的输出形状(行数或列数)为:output_shape = math.floor((input_shape - pool_size) / strides) + 1(当input_shape >= pool_size时)

当使用"same"填充选项时,生成的输出形状为:output_shape = math.floor((input_shape - 1) / strides) + 1

例如,对于strides=(1, 1)padding="valid"

>>> x = tf.constant([[1., 2., 3.],
...                  [4., 5., 6.],
...                  [7., 8., 9.]])
>>> x = tf.reshape(x, [1, 3, 3, 1])
>>> avg_pool_2d = tf.keras.layers.AveragePooling2D(pool_size=(2, 2),
...    strides=(1, 1), padding='valid')
>>> avg_pool_2d(x)
<tf.Tensor: shape=(1, 2, 2, 1), dtype=float32, numpy=
  array([[[[3.],
           [4.]],
          [[6.],
           [7.]]]], dtype=float32)>

例如,对于stride=(2, 2)padding="valid"

>>> x = tf.constant([[1., 2., 3., 4.],
...                  [5., 6., 7., 8.],
...                  [9., 10., 11., 12.]])
>>> x = tf.reshape(x, [1, 3, 4, 1])
>>> avg_pool_2d = tf.keras.layers.AveragePooling2D(pool_size=(2, 2),
...    strides=(2, 2), padding='valid')
>>> avg_pool_2d(x)
<tf.Tensor: shape=(1, 1, 2, 1), dtype=float32, numpy=
  array([[[[3.5],
           [5.5]]]], dtype=float32)>

例如,对于strides=(1, 1)padding="same"

>>> x = tf.constant([[1., 2., 3.],
...                  [4., 5., 6.],
...                  [7., 8., 9.]])
>>> x = tf.reshape(x, [1, 3, 3, 1])
>>> avg_pool_2d = tf.keras.layers.AveragePooling2D(pool_size=(2, 2),
...    strides=(1, 1), padding='same')
>>> avg_pool_2d(x)
<tf.Tensor: shape=(1, 3, 3, 1), dtype=float32, numpy=
  array([[[[3.],
           [4.],
           [4.5]],
          [[6.],
           [7.],
           [7.5]],
          [[7.5],
           [8.5],
           [9.]]]], dtype=float32)>

参数

  • pool_size:整数或包含2个整数的元组,表示缩小的倍数(垂直,水平)。(2, 2)将使输入在两个空间维度上减半。如果只指定一个整数,则两个维度都将使用相同的窗口长度。
  • strides:整数、包含2个整数的元组或None。步长值。如果为None,则默认为pool_size
  • padding"valid""same"之一(不区分大小写)。"valid"表示不填充。"same"导致在输入的左右或上下均匀填充,以便输出具有与输入相同的高度/宽度维度。
  • data_format:字符串,channels_last(默认)或channels_first之一。输入中维度的顺序。channels_last对应于形状为(batch, height, width, channels)的输入,而channels_first对应于形状为(batch, channels, height, width)的输入。如果未指定,则使用 TF-Keras 配置文件(如果存在)中 ~/.keras/keras.json 中找到的 image_data_format 值,否则为'channels_last'。默认为'channels_last'。

输入形状

  • 如果data_format='channels_last':形状为(batch_size, rows, cols, channels)的4D张量。
  • 如果data_format='channels_first':形状为(batch_size, channels, rows, cols)的4D张量。

输出形状

  • 如果data_format='channels_last':形状为(batch_size, pooled_rows, pooled_cols, channels)的4D张量。
  • 如果data_format='channels_first':形状为(batch_size, channels, pooled_rows, pooled_cols)的4D张量。