python学习笔记3.1_数据读取常用函数参数

时间:2023-03-09 17:55:09
python学习笔记3.1_数据读取常用函数参数

一、read_table/read_csv常用函数参数

1、path:表明文件系统位置的字符串、url或文件型对象

python学习笔记3.1_数据读取常用函数参数

2、sep或delimiter:用于分隔每行字段的字符序列或正则表达式

python学习笔记3.1_数据读取常用函数参数

3、header:用作列名的行号,默认是0(第一行),如果没有列名的话,应该指定为None

python学习笔记3.1_数据读取常用函数参数

4、names:结果的列名列表,和header=None一起用。

python学习笔记3.1_数据读取常用函数参数

5、index_col: 用作结果中行索引的列号或列名,可以是一个单一的名称/数字,也可以是一个分层索引。

python学习笔记3.1_数据读取常用函数参数

python学习笔记3.1_数据读取常用函数参数

python学习笔记3.1_数据读取常用函数参数

6、skiprows:从文件开头处起,需要跳过的行数或行号列表。

python学习笔记3.1_数据读取常用函数参数

7、na_values:需要用NA替换的值序列。

python学习笔记3.1_数据读取常用函数参数

缺失值默认显示为NULL(用NAN表示)

python学习笔记3.1_数据读取常用函数参数

python学习笔记3.1_数据读取常用函数参数

na_nalues指定缺失值显示为NULL(用NAN表示)

python学习笔记3.1_数据读取常用函数参数

通过字典形式,na_values可指定不同列缺失值显示为不同的值

python学习笔记3.1_数据读取常用函数参数

8、nrows:分块读入文件

max_rows:在尝试大文件之前,我们可以先对pandas的显示设置进行调整,使之更为紧凑

如果指向读取一小部分行,可以指明nrows:

python学习笔记3.1_数据读取常用函数参数

python学习笔记3.1_数据读取常用函数参数

python学习笔记3.1_数据读取常用函数参数