【文件属性】:
文件名称:python去除不可见字符 x00.docx
文件大小:13KB
文件格式:DOCX
更新时间:2023-04-03 03:42:59
python 字符处理
python 去除不可见字符 \x00
问题:无法用.split(' ') 分割空格字符
对接收到数据进行分割空格字符处理
# 原始数据
list1 = ['1', '1563028486', 'alan', 'DESKTOP-UPVCQFQ', '33', 'alan\x00WorkGroup\x00DC-85-DE-BB-D2-F1\x00']
msg = list1[-1].split()
print(msg)
打印结果
['alan\x00WorkGroup\x00DC-85-DE-BB-D2-F1\x00']
发现list[-1]中包含“\x00” ,这个和空格是有区别的,“\x00”不等于空格,所以不能直接用.split(' ') 分割
split()只能去掉\r,\\n,\t,无法去掉\x00。
解决办法:
在源码后添加.strip(b'\x00'.decode()).split(b'\x00'.decode())
.strip(b'\x00'.decode()) 是去掉最后的 \x00
.split(b'\x00'.decode()) 是对list进行分割 \x00
代码:
# 原始数据
list1 = ['1', '1563028486', 'alan', 'DESKTOP-UPVCQFQ', '33', 'alan\x00WorkGroup\x00DC-85-DE-BB-D2-F1\x00']
msg = list1[-1].strip(b'\x00'.decode()).split(b'\x00'.decode())
print(type(msg))
print(msg)