Model 类

`Model` 类

tf_keras.Model()

一个将层组合成具有训练/推理特性的对象的模型。

参数

inputs: 模型的输入：一个 keras.Input 对象，或者一个 keras.Input 对象在字典、列表或元组中的组合。
outputs: 模型的输出：一个源自 keras.Input 对象的张量，或者此类张量在字典、列表或元组中的组合。请参见下面的函数式 API 示例。
name: 字符串，模型的名称。

有两种方法可以实例化 Model

1 - 使用“函数式 API”，从 Input 开始，将层调用链接起来以指定模型的前向传递，最后从输入和输出创建模型。

import tensorflow as tf

inputs = tf.keras.Input(shape=(3,))
x = tf.keras.layers.Dense(4, activation=tf.nn.relu)(inputs)
outputs = tf.keras.layers.Dense(5, activation=tf.nn.softmax)(x)
model = tf.keras.Model(inputs=inputs, outputs=outputs)

注意：仅支持输入张量的字典、列表和元组。不支持嵌套输入（例如，列表的列表或字典的字典）。

也可以使用中间张量创建新的函数式 API 模型。这使您可以快速提取模型的子组件。

示例

inputs = keras.Input(shape=(None, None, 3))
processed = keras.layers.RandomCrop(width=32, height=32)(inputs)
conv = keras.layers.Conv2D(filters=2, kernel_size=3)(processed)
pooling = keras.layers.GlobalAveragePooling2D()(conv)
feature = keras.layers.Dense(10)(pooling)

full_model = keras.Model(inputs, feature)
backbone = keras.Model(processed, conv)
activations = keras.Model(conv, feature)

请注意，backbone 和 activations 模型不是使用 keras.Input 对象创建的，而是使用源自 keras.Input 对象的张量创建的。在底层，层和权重将在这些模型之间共享，以便用户可以训练 full_model，并使用 backbone 或 activations 进行特征提取。模型的输入和输出也可以是张量的嵌套结构，并且创建的模型是支持所有现有 API 的标准函数式 API 模型。

2 - 通过子类化 Model 类：在这种情况下，您应该在 __init__() 中定义您的层，并且您应该在 call() 中实现模型的前向传递。

import tensorflow as tf

class MyModel(tf.keras.Model):

  def __init__(self):
    super().__init__()
    self.dense1 = tf.keras.layers.Dense(4, activation=tf.nn.relu)
    self.dense2 = tf.keras.layers.Dense(5, activation=tf.nn.softmax)

  def call(self, inputs):
    x = self.dense1(inputs)
    return self.dense2(x)

model = MyModel()

如果您子类化 Model，您可以选择在 call() 中有一个 training 参数（布尔值），您可以使用该参数来指定训练和推理中的不同行为。

import tensorflow as tf

class MyModel(tf.keras.Model):

  def __init__(self):
    super().__init__()
    self.dense1 = tf.keras.layers.Dense(4, activation=tf.nn.relu)
    self.dense2 = tf.keras.layers.Dense(5, activation=tf.nn.softmax)
    self.dropout = tf.keras.layers.Dropout(0.5)

  def call(self, inputs, training=False):
    x = self.dense1(inputs)
    if training:
      x = self.dropout(x, training=training)
    return self.dense2(x)

model = MyModel()

创建模型后，您可以使用 model.compile() 配置模型的损失函数和指标，使用 model.fit() 训练模型，或使用模型使用 model.predict() 进行预测。

[源代码]

`summary` 方法

Model.summary(
    line_length=None,
    positions=None,
    print_fn=None,
    expand_nested=False,
    show_trainable=False,
    layer_range=None,
)

打印网络的字符串摘要。

参数

line_length: 打印行的总长度（例如，将其设置为适应不同终端窗口大小的显示）。
positions: 每行中日志元素的相对或绝对位置。如果未提供，则变为 [0.3, 0.6, 0.70, 1.]。默认为 None。
print_fn: 要使用的打印函数。默认情况下，打印到 stdout。如果 stdout 在您的环境中不起作用，请更改为 print。它将在摘要的每一行上调用。您可以将其设置为自定义函数以捕获字符串摘要。
expand_nested: 是否展开嵌套模型。默认为 False。
show_trainable: 是否显示某层是否可训练。默认为 False。
layer_range: 一个包含 2 个字符串的列表或元组，它是起始层名称和结束层名称（均包含），指示要在摘要中打印的层范围。它也接受正则表达式模式而不是确切的名称。在这种情况下，开始谓词将是它匹配到 layer_range[0] 的第一个元素，结束谓词将是它匹配到 layer_range[1] 的最后一个元素。默认为 None，表示模型的所有层。

引发

ValueError: 如果在构建模型之前调用 summary()。

[源代码]

`get_layer` 方法

Model.get_layer(name=None, index=None)

根据其名称（唯一）或索引检索层。

如果同时提供了 name 和 index，则 index 将优先。索引基于水平图遍历的顺序（自下而上）。

参数

name: 字符串，层的名称。
index: 整数，层的索引。

一个层实例。

Model 类

Model 类

summary 方法

get_layer 方法

Model 类

Model 类

summary 方法

get_layer 方法

`Model` 类

`summary` 方法

`get_layer` 方法