python字符串格式和编码与解码问题

时间:2023-03-09 17:40:10
python字符串格式和编码与解码问题
 %c   转换成字符(ASCII码值,长度为一的字符串)

 %r   有线使用repr()函数进行字符串转换

 %s   有线使用str()函数进行字符串转换

 %d or  %i    转换成有符号十进制数

 %u   转换成无符号十进制数

 %o   转换成无符号八进制数

 %x   %X   转换成无符号十六进制数(x/X代表大小写)

 %e  % E转换成科学计数法

 %f  %F 转换成浮点型

 quest="what's your quest?"

 ':' . join(quest.split())   #"what's:your:quest?"

列表的extend()方法是把新列表添加到原有列表里而不是像连接操作那样新建一个列表

Unicode支持多种编码格式,例如ASCII,ISO8859-1/Latin-1,UTF-8,UTF-16等,每当向一个文件写入字符串的时候,必须定义一个编码(encoding参数)用于对应的Unicode内容转换成定义的格式,python中Unicode字符串的 encode()函数接受字符串中字符为参数输出指定的编码格式内容。

写Unicode字符串到磁盘上时要用指定的编码器给他“编码”,从该文件读取数据时需“解码”该文件,使之成为相应的Unicode字符串对象.

 file="unicode.txt"

 hello_out=u"Hello world\n" #unicode编码的字符串

 bytes_out=hello_out.encode('utf-8') #写进文件前将其编码成utf-8编码(二进制流形式)

 print(bytes_out) #b'Hello world\n'

 f=open(file,"wb") #二进制流形式读取文件,不能直接字符串形式读取
# 因为后面写入utf-8编码后字符串(二进制流)需要以二进制方式打开文件 f.write(bytes_out)
f.close() with open(file,'rb') as f:
bytes_in=f.read() hello_in=bytes_in.decode('utf-8')
#从文件读取数据时需要 解码该文件 print(hello_in)