阅读(8.6k) 书签赞(0)

TensorFlow函数：tf.SparseFeature

2018-01-30 10:43 更新

tf.SparseFeature 函数

SparseFeature 类

定义在：tensorflow/python/ops/parsing_ops.py.

请参阅指南：输入和读取器>协议缓冲区示例

从一个Example中分析稀疏输入功能的配置.

请注意,最好使用VarLenFeature(可能与SequenceExample组合)来解析SparseTensors,而不是SparseFeature,由于其简单性.

这将通过解析一个带有SparseFeature配置的一个Example来密切地模仿将获得的SparseTensor,一个SparseFeature包含如下部分：

value_key：在Example中Feature的键的名称,其解析Tensor将是结果SparseTensor.values.
index_key：一个名称的列表；一个用于在所产生的SparseTensor中的每个维度,其indices[i][dim]指示的dim维度中的第 i 值的位置将等同于Example中具有键名为index_key [dim]的Feature中的第 i 值.
size：生成的 SparseTensor. dense_shape 的整数列表.

例如,我们可以表示下面的2D SparseTensor：

SparseTensor(indices=[[3, 1], [20, 0]],
             values=[0.5, -1.0]
             dense_shape=[100, 3])

带有一个Example输入原型：

features {
  feature { key: "val" value { float_list { value: [ 0.5, -1.0 ] } } }
  feature { key: "ix0" value { int64_list { value: [ 3, 20 ] } } }
  feature { key: "ix1" value { int64_list { value: [ 1, 0 ] } } }
}

并且SparseFeature使用2个index_key配置：

SparseFeature(index_key=["ix0", "ix1"],
              value_key="val",
              dtype=tf.float32,
              size=[100, 3])

字段：

index_key: 单个字符串名称或索引功能的字符串名称列表.对于每个键, 基础特征的类型必须是 int64 的, 并且它的长度必须始终与 value_key 特征的匹配.要代表 SparseTensors 与 dense_shape 等级高于1一个长度等级名单应该使用.value_key: 值功能的名称.基础特征的类型必须是 dtype 的, 并且它的长度必须与所有 index_keys 的特征相匹配.dtype: value_key 特征的数据类型.大小: 一个 Python int 或它的列表, 它指定稠密的形状.应该是一个列表, 如果和仅当 index_key 是一个列表.在这种情况下, 列表必须等于 index_key 的长度.每个条目 i 所有值的 index_key [i] 功能必须在 [0, 大小 [i]).already_sorted: 一个 Python 布尔值, 用于指定是否已按照 value_key 的索引位置对其进行排序.如果是这样跳过排序.默认为 False (可选).

index_key：单个字符串名称或索引功能的字符串名称列表.对于每个键,基础功能的类型必须是int64,并且其长度必须始终与 value_key 功能的长度相匹配.为了表示带有dense_shape的rank大于1的SparseTensor s,长度为rank的列表应该被使用.
value_key：值功能的名称.基础功能的类型必须是dtype,其长度必须始终与所有index_key的特征的相匹配.
dtype：index_key功能的数据类型.
size：指定稠密形状的Python int或其列表.应该是一个列表,当且仅当index_key是一个列表.在这种情况下,列表必须等于index_key的长度.每个项 i 中的index_key[i]功能中的所有值都必须在[0, size[i]).
already_sorted：一个Python布尔值,用来指定值value_key是否已经按索引位置排序.如果这样则跳过排序；默认为false.

属性

already_sorted
字段编号4的别名
dtype
字段编号2的别名
index_key
0字段编号0的别名
size
字段编号3的别名
value_key
字段编号1的别名

方法

new

@staticmethod
__new__(
    cls,
    index_key,
    value_key,
    dtype,
    size,
    already_sorted=False
)

← TensorFlow：tf.SparseConditionalAccumulator函数

TensorFlow稀疏张量函数：tf.SparseTensor →