12个Python数据处理常用内置函数

时间:2022-10-29 23:21:57

12个Python数据处理常用内置函数

在python数据分析中,经常需要对字符串进行各种处理,例如拼接字符串、检索字符串等。下面我将对python中常用的内置字符串操作函数进行介绍。

1.计算字符串的长度-len()函数

  1. str1='我爱python' 
  2. length=len(str1) 
  3. print(length) 

len()函数在计算字符串的长度时,不区分英文、数字和汉字,所有字符都按一个字符计算。

有时,我们需要获取字符串实际所占的字节,即计算python默认编码UTF-8下的实际字节长度,可以这样做:

  1. str1='我爱python' 
  2. length=len(str1.encode()) 
  3. print(length) 

12

和UTF-8编码下一个汉字占3个字节相吻合

2.分割字符串

split()方法可以实现字符串分割,也就是把一个字符串按照指定的分割符分割为字符串列表。具体语法格式如下

  1. str.split(sep,maxsplit) 

参数说明:

  1. str:表示要分割的字符串  
  2. sep:指定的分割符  
  3. maxsplit:用于指定分割的次数 

3.统计某字符出现的次数

count()方法用于检索某字符串在另一字符串中出现的次数,语法格式如下:

  1. str.count(str1) 

参数说明:

  1. str:表示原字符串 
  2. str1:表示要检索的字符串 

4.检索某字符串是否存在(find)

find()方法用于检索是否包含指定的子字符串。如果检索的字符串不存在,则返回-1,否则返回首次出现该子字符串的索引。其语法格式如下:

  1. str.find(str1) 

参数说明:

  1. str:表示原字符 
  2. str1:表示要检索的子字符串 

5.检索某字符串是否存在(index)

index()与find()方法类似,也是用于检索是否包含指定的子字符串。只不过index()方法在指定字符串不存在是会抛出异常。具体语法如下:

  1. str.index(str1) 

参数说明:

  1. str:表示原字符 
  2. str1:表示要检索的子字符串 

6.检索字符串是否已指定字符串开头

这里用到startswith()方法,如果是则返回True,否则返回False,具体语法如下:

  1. str.startswith(str1) 

参数说明:

  1. str:表示原字符 
  2. str1:表示要检索的子字符串 

7.检索字符串是否已指定字符串结尾

这里用到endswith()方法,如果是则返回True,否则返回False,具体语法如下:

  1. str.endswith(str1) 

参数说明:

  1. str:表示原字符 
  2. str1:表示要检索的子字符串 

8.大写字母转小写字母

lower()方法用于价格字符串中的大写字母转换为小写字母,语法格式如下:

  1. str.lower() 

9.小写字母转换为大写字母

upper()方法用于价格字符串中的小写字母转换为大写字母,语法格式如下:

  1. str.upper() 

10.删除空格和特殊字符

strip()方法用于去掉字符串左、右两侧的空格和特殊字符,语法格式如下:

  1. str.strip([chars]) 

参数说明:

  1. str:表示原字符 
  2. chars:为可选参数,用于指定要取出的字符,可以指定多个。如果chars为“@”,则取出左、右两侧包括的“@”“。”。如果不指定chars参数,默认去除空格、制表符“\t”、回车符“\r”、换行符“\n”等 

11.去掉字符串左侧的字符

lstrip()方法用于去掉字符串左侧的空格和特殊字符,语法格式如下:

  1. str.lstrip([chars]) 

参数说明:

  1. str:表示原字符 
  2. chars:为可选参数,用于指定要取出的字符,可以指定多个。如果chars为“@”,则取出左、右两侧包括的“@”“。”。如果不指定chars参数,默认去除空格、制表符“\t”、回车符“\r”、换行符“\n”等 

12.去掉字符串右侧的字符

rstrip()方法用于去掉字符串右侧的空格和特殊字符,语法格式如下:

  1. str.rstrip() 

参数说明:

  1. str:表示原字符 
  2. chars:为可选参数,用于指定要取出的字符,可以指定多个。如果chars为“@”,则取出左、右两侧包括的“@”“。”。如果不指定chars参数,默认去除空格、制表符“\t”、回车符“\r”、换行符“\n”等 

原文地址:https://mp.weixin.qq.com/s/IFy-NJ3Uq8iQwXn2bvSCyQ