HashedCrossing
类keras.layers.HashedCrossing(
num_bins, output_mode="int", sparse=False, name=None, dtype=None, **kwargs
)
使用“哈希技巧”交叉特征的预处理层。
此层使用“哈希技巧”对分类特征进行交叉。从概念上讲,此转换可以看作是:hash(concatenate(features)) % num_bins
。
此层目前仅对标量输入和标量输入批次执行交叉。有效的输入形状为 (batch_size, 1)
、(batch_size,)
和 ()
。
注意:此层封装了 tf.keras.layers.HashedCrossing
。它不能作为模型编译计算图的一部分与除 TensorFlow 之外的任何后端一起使用。但是,在急切执行时,它可以与任何后端一起使用。它也可以始终作为输入预处理管道的一部分与任何后端一起使用(在模型本身之外),这是我们推荐使用此层的方式。
注意:此层可以在 tf.data
管道中使用(与您使用的后端无关)。
参数
"int"
或 "one_hot"
,配置层如下:"int"
:直接返回整数桶索引。"one_hot"
:将输入中的每个独立元素编码为一个与 num_bins
大小相同的数组,在输入的桶索引处包含一个 1。默认为 "int"
。"one_hot"
模式,并且仅在使用 TensorFlow 后端时有效。如果为 True
,则返回一个 SparseTensor
而不是一个密集 Tensor
。默认为 False
。示例
交叉两个标量特征。
>>> layer = keras.layers.HashedCrossing(
... num_bins=5)
>>> feat1 = np.array(['A', 'B', 'A', 'B', 'A'])
>>> feat2 = np.array([101, 101, 101, 102, 102])
>>> layer((feat1, feat2))
array([1, 4, 1, 1, 3])
交叉并进行独热编码两个标量特征。
>>> layer = keras.layers.HashedCrossing(
... num_bins=5, output_mode='one_hot')
>>> feat1 = np.array(['A', 'B', 'A', 'B', 'A'])
>>> feat2 = np.array([101, 101, 101, 102, 102])
>>> layer((feat1, feat2))
array([[0., 1., 0., 0., 0.],
[0., 0., 0., 0., 1.],
[0., 1., 0., 0., 0.],
[0., 1., 0., 0., 0.],
[0., 0., 0., 1., 0.]], dtype=float32)