Python做文本处理

时间:2022-12-20 13:49:35

Python将文本文件的内容读入可以操作的字符串常量非常容易。文件对象提供了三个读方法:.read()、.readline()、.readlines()。每种方法接受一个变量以限制每次读取的数据量,但它们通常不使用变量。.read()每次读取整个文件,它通常将文件内容放到一个字符串常量中,它生成文件内容醉直接的字符串表示,但对于连续的面向行的处理,它却是不必要的,如果文件大于可用内存,则不可能实现这种处理。
.readline()和.readlines()非常相似,它们都在类似结构中使用:

fr=open('..../data.csv')
for line in fr.readlines():
.....

.readline()和.readlines()的差异在于后者一次读取整个文件,并自动将文件内容分析成一个行的列表,该列表可以由python 的for…in…结构进行处理,.readline()每次只读取一行,通常比.readlines()慢得多。一般当一次读取内存不够时才使用.readline()。