阅读(9.1k) 书签 (0)

TensorFlow函数:tf.string_to_hash_bucket_fast

2018-03-22 11:08 更新

tf.string_to_hash_bucket_fast函数

tf.string_to_hash_bucket_fast(
    input,
    num_buckets,
    name=None
)

请参阅指南:字符串操作>散列

通过多个 bucket 将输入张量中的每个字符串转换为哈希模式.

哈希函数对进程内字符串的内容是确定性的,并且永远不会改变.但是,它不适用于密码学.当 CPU 时间不足且输入可信或不重要时,可使用tf.string_to_hash_bucket_fast函数.需要注意的一个风险是,对手有可能将所有哈希值输入到同一个 bucket 中.为了防止这个问题,使用一个强大的散列函数:tf.string_to_hash_bucket_strong.

函数参数:

  • input:一个 string 类型的 Tensor,表示要分配散列 bucket 的字符串.
  • num_buckets:一个大于等于 1 的 int,表示 bucket 的数量.
  • name:操作的名称(可选).

函数返回值:

该tf.string_to_hash_bucket_fast函数返回一个 int64 类型的 Tensor.