阅读(8.7k) 书签 (0)

TensorFlow函数教程:tf.io.decode_csv

2019-02-22 16:14 更新

tf.io.decode_csv函数

别名:

  • tf.decode_csv
  • tf.io.decode_csv
tf.io.decode_csv(
    records,
    record_defaults,
    field_delim=',',
    use_quote_delim=True,
    name=None,
    na_value='',
    select_cols=None
)

定义在:tensorflow/python/ops/parsing_ops.py。

将CSV记录转换为张量。每列映射到一个张量。

RFC 4180格式适用于CSV记录。(https://tools.ietf.org/html/rfc4180)请注意,我们允许在int或float字段中使用前导和尾部空格。

参数:

  • records:一个string类型的Tensor。每个字符串都是csv中的记录/行,所有记录都应具有相同的格式。
  • record_defaults:具有特定类型的Tensor对象列表。可接受的类型有float32,float64,int32,int64,string。输入记录的每列一个张量,具有该列的标量默认值或者如果需要该列则为空向量。
  • field_delim:可选的string。默认为","。用于分隔记录中字段的char分隔符。
  • use_quote_delim:可选的bool。默认为True。如果为false,则将双引号视为字符串字段内的常规字符。
  • name:操作的名称(可选)。
  • na_value:要识别为NA/NaN的附加字符串。
  • select_cols:可选的列索引的可选排序列表。如果指定,则仅解析并返回此列的子集。

返回:

Tensor对象列表。与record_defaults具有相同的类型。每个张量将与记录具有相同的形状。

可能引发的异常:

  • ValueError:如果任何参数格式错误。