paip.utf-8,unicode编码的本质输出unicode文件原理 python

时间:2023-03-08 17:24:18

paip.utf-8,unicode编码的本质输出unicode文件原理 python

 

 

 #别的语言,java php都是unicode,走十python不一样.

 

 #enddef

 #todo write to unicode encode

fileHandle = open ( r"c:\fmtSmpEnRst.txt", 'w',encoding="UTF-16" )      





 #todox utf8 not decode...now  UTF-16是Unicode

    lines=file2list(f, encode="utf-16")

    

    作者 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com

转载请注明来源: http://blog.****.net/attilax





#原理







一般所谓的unicode 其实是utf-16,双字节或者4字节。



utf-8是多字节。



真正的unicode其实只是对文字的一个唯一编码,utf-8,utf-16都是这个编码到文件的一种实现方式。



 ,unicode和gbk是编码的值,而utf-8和utf-16是编码的表现形式



是的,unicode准确说是一个字符编码表,而utf-32,utf-16,utf-8是unicode这个字符编码表的传输方式。比如  UTF-8    





所以,甚至可以把utf-8,unicode,gbk理解成不同的编码,中间通过unicode转换,呵呵。