阅读(17.6k) 书签 (0)

TensorFlow张量变换函数:tf.sequence_mask

2018-01-16 10:44 更新

tf.sequence_mask 函数

sequence_mask(
    lengths,
    maxlen=None,
    dtype=tf.bool,
    name=None
)

定义在:tensorflow/python/ops/array_ops.py.

参见指南:张量变换>分割和连接

返回一个表示每个单元的前N个位置的mask张量.

如果lengths的形状为[d_1, d_2, ..., d_n],由此产生的张量mask有dtype类型和形状[d_1, d_2, ..., d_n, maxlen],并且:

mask[i_1, i_2, ..., i_n, j] = (j < lengths[i_1, i_2, ..., i_n])

示例如下:

tf.sequence_mask([1, 3, 2], 5)  # [[True, False, False, False, False],
                                #  [True, True, True, False, False],
                                #  [True, True, False, False, False]]

tf.sequence_mask([[1, 3],[2,0]])  # [[[True, False, False],
                                  #   [True, True, True]],
                                  #  [[True, True, False],
                                  #   [False, False, False]]]

函数参数

  • lengths:整数张量,其所有值小于等于maxlen.
  • maxlen:标量整数张量,返回张量的最后维度的大小;默认值是lengths中的最大值.
  • dtype:结果张量的输出类型.
  • name:操作的名字.

函数返回值

形状为lengths.shape + (maxlen,)的mask张量,投射到指定的dtype.

函数中可能存在的异常

  • ValueError:如果maxlen不是标量.