TensorFlow函数教程:tf.io.decode_csv
2019-02-22 16:14 更新
tf.io.decode_csv函数
别名:
- tf.decode_csv
- tf.io.decode_csv
tf.io.decode_csv(
records,
record_defaults,
field_delim=',',
use_quote_delim=True,
name=None,
na_value='',
select_cols=None
)
定义在:tensorflow/python/ops/parsing_ops.py。
将CSV记录转换为张量。每列映射到一个张量。
RFC 4180格式适用于CSV记录。(https://tools.ietf.org/html/rfc4180)请注意,我们允许在int或float字段中使用前导和尾部空格。
参数:
- records:一个string类型的Tensor。每个字符串都是csv中的记录/行,所有记录都应具有相同的格式。
- record_defaults:具有特定类型的Tensor对象列表。可接受的类型有float32,float64,int32,int64,string。输入记录的每列一个张量,具有该列的标量默认值或者如果需要该列则为空向量。
- field_delim:可选的string。默认为","。用于分隔记录中字段的char分隔符。
- use_quote_delim:可选的bool。默认为True。如果为false,则将双引号视为字符串字段内的常规字符。
- name:操作的名称(可选)。
- na_value:要识别为NA/NaN的附加字符串。
- select_cols:可选的列索引的可选排序列表。如果指定,则仅解析并返回此列的子集。
返回:
Tensor对象列表。与record_defaults具有相同的类型。每个张量将与记录具有相同的形状。
可能引发的异常:
- ValueError:如果任何参数格式错误。