ASCII码:
一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。如一个ASCII码就是一个字节。
UTF-8编码:
一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。
Unicode编码:
一个英文等于两个字节,一个中文(含繁体)等于两个字节。
符号:
英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小。
相关文章
- Java中字符编码问题和中文占几个字节的问题(ASCII Unicode UTF-8 )
- 字符编码的种类:ASCII、GB2312、GBK、GB18030、Unicode、UTF-8、UTF-16、Base64
- ASCII、Unicode、GBK和UTF-8字符编码的区别联系
- 浅析ASCII、Unicode和UTF-8三种常见字符编码
- 字符编码的故事:ASCII,GB2312,Unicode,UTF-8,UTF-16
- 字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?
- 编码解码--三种常见字符编码简介:ASCII、Unicode和UTF-8
- 字符编码笔记:ASCII,Unicode和UTF-8,附带 Little endian和Big endian的解释
- 【转】关于字符编码,你所需要知道的(ASCII,Unicode,Utf-8,GB2312…)
- 字符编码的故事:ASCII,GB2312,Unicode,UTF-8,UTF-16