utf-8 gbk gb2312有什么区别?

时间:2022-10-21 15:46:58
utf-8  gbk  gb2312有什么区别? 分别在什么场合用到?
请指教!
        谢谢!

34 个解决方案

#1


utf-8是基于unicode的 国际化的场合适合使用
gb2312和gb2312都是国标码 出现的较早 主要用于编解码常用汉字 

#2


不同的字符编码方案,文本最终表示为二进制码时候的格式

解释如一楼,编码方案多如牛毛,utf-8较通用,号称可表示全世界的各种语言文字编码

#3


引用 1 楼 dracularking 的回复:
utf-8是基于unicode的 国际化的场合适合使用 
gb2312和gb2312都是国标码 出现的较早 主要用于编解码常用汉字  

支持。。。
gb2312和gbk 的一个区别是 :gb2312 出来得比较早 ,所以有一些汉字和繁体好象不支持。gbk 是一个改进版。所以能用gbk的时候一般不用gb2312

#4


涉及到多种语言用utf-8编码
gb2312和gbk都是中文编码,gbk包含的更全面

#5


引用 3 楼 caoyinghui1986 的回复:
引用 1 楼 dracularking 的回复:
utf-8是基于unicode的 国际化的场合适合使用  
gb2312和gb2312都是国标码 出现的较早 主要用于编解码常用汉字   
 
支持。。。 
gb2312和gbk 的一个区别是 :gb2312 出来得比较早 ,所以有一些汉字和繁体好象不支持。gbk 是一个改进版。所以能用gbk的时候一般不用gb2312

#6


注意不同数据编码方式不同,从数据库里拿出来的时候,要与页面显示表示一致,所以,要记得转码

#7


哦 了解了

#8


少了一个gb18030 ,hoho~

#9


UTF-8:Unicode Transformation Format-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。

GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。

GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

GBK、GB2312--Unicode--UTF8

UTF8--Unicode--GBK、GB2312

对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。

#10


http://dev.csdn.net/article/72888.shtm
unicode是理论 utf8是实现方式

#11


引用 5 楼 skyqiang 的回复:
引用 3 楼 caoyinghui1986 的回复:
引用 1 楼 dracularking 的回复: 
utf-8是基于unicode的 国际化的场合适合使用   
gb2312和gb2312都是国标码 出现的较早 主要用于编解码常用汉字    
  
支持。。。  
gb2312和gbk 的一个区别是 :gb2312 出来得比较早 ,所以有一些汉字和繁体好象不支持。gbk 是一个改进版。所以能用gbk的时候一般不用gb2312 

#12


utf-8>gbk>gb2312

#13


如果代码中出现汉字 UTF-8 不可保存!

#14


utf-8是jsp默认的,有中文时必需加入GBK/GB2312

#15


utf-8 gbk gb2312有什么区别?utf-8 gbk gb2312有什么区别?

#16


如果你编写的系统可能运行在英文(或者其他非中文)平台下,建议使用UTF-8,其国际化通用性较好。。
如果只是运行在中文平台下,使用GB2312或GBK(K是扩展的汉语拼音的第一个字母)。。
其中,GB2312是国家标准,GBK只是规范而已。。。

#17


学习一下~~

#18


进来学习下~~~

#19


明白了它们的区别了,谢谢

#20


gb2312编码集GBK编码的比较

gb2312编码简介
gb2312(又称为GB 2312-80)编码是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集·基本集》,又称为GB0,由中国国家标准总局发布,1981年5月1日实施。
更多详细介绍http://zh.wikipedia.org/zh-cn/Gb2312

GBK编码简介
GBK全名为汉字内码扩展规范,英文名Chinese Internal Code Specification。K 即是“扩展”所对应的汉语拼音(KuoZhan11)中“扩”字的声母。GBK 来自中国国家标准代码GB 13000.1-93。
更多详细介绍http://zh.wikipedia.org/zh-cn/GBK

GBK编码产生的原因
由于GB2312-80只收录了6763个汉字,有不少汉字,如部分在GB 2312-80推出以后才简化的汉字(如“啰”),部分人名用字(如中国前总理*的“镕”字),*及香港使用的繁体字,日语及朝鲜语汉字等,并未有收录在内。中文电脑开发商,于是利用了GB 2312-80未有使用的编码空间,收录了所有出现在Unicode 1.1及GB 13000.1-93之中的汉字,制定了GBK编码。

在实际的项目开发中,使用gb2312编码经常会造成部分人名无法正常显示,所以一般推荐使用GBK编码,比如:

<%@ page  pageEncoding="GBK"%>

from:http://www.darkmi.com/blog/archives/1042






#21


很好   又学习了一下下

#22


如果不设置编码的话,那默认的是什么呢





包装机

#23


引用 22 楼 packmarket 的回复:
如果不设置编码的话,那默认的是什么呢





包装机


会用操作系统默认的编码.

#24


3q,学习哈

#25


学习一下

#26


&#55369;学习了、、、学习学习学习布雷dafdasdfasddddd

#27


挺好的,来学习一下

#28


学习了 呵呵 很受教

#29


学习了

#30


学习了,明白了GBK、GB2312和UTF-8的区别了

#31


学习了 太好了  现在正好想理解一下  这方面的问题 听了大家说的  一下子感觉清醒了很多的

#32


又一次熟悉,多谢

#33


不错,学习了!

#34


个人认为gbk  gb2312完全没用,完全没必要去用这2个  撒都用utf-8  可以少操多少心

#1


utf-8是基于unicode的 国际化的场合适合使用
gb2312和gb2312都是国标码 出现的较早 主要用于编解码常用汉字 

#2


不同的字符编码方案,文本最终表示为二进制码时候的格式

解释如一楼,编码方案多如牛毛,utf-8较通用,号称可表示全世界的各种语言文字编码

#3


引用 1 楼 dracularking 的回复:
utf-8是基于unicode的 国际化的场合适合使用 
gb2312和gb2312都是国标码 出现的较早 主要用于编解码常用汉字  

支持。。。
gb2312和gbk 的一个区别是 :gb2312 出来得比较早 ,所以有一些汉字和繁体好象不支持。gbk 是一个改进版。所以能用gbk的时候一般不用gb2312

#4


涉及到多种语言用utf-8编码
gb2312和gbk都是中文编码,gbk包含的更全面

#5


引用 3 楼 caoyinghui1986 的回复:
引用 1 楼 dracularking 的回复:
utf-8是基于unicode的 国际化的场合适合使用  
gb2312和gb2312都是国标码 出现的较早 主要用于编解码常用汉字   
 
支持。。。 
gb2312和gbk 的一个区别是 :gb2312 出来得比较早 ,所以有一些汉字和繁体好象不支持。gbk 是一个改进版。所以能用gbk的时候一般不用gb2312

#6


注意不同数据编码方式不同,从数据库里拿出来的时候,要与页面显示表示一致,所以,要记得转码

#7


哦 了解了

#8


少了一个gb18030 ,hoho~

#9


UTF-8:Unicode Transformation Format-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。

GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。

GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

GBK、GB2312--Unicode--UTF8

UTF8--Unicode--GBK、GB2312

对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。

#10


http://dev.csdn.net/article/72888.shtm
unicode是理论 utf8是实现方式

#11


引用 5 楼 skyqiang 的回复:
引用 3 楼 caoyinghui1986 的回复:
引用 1 楼 dracularking 的回复: 
utf-8是基于unicode的 国际化的场合适合使用   
gb2312和gb2312都是国标码 出现的较早 主要用于编解码常用汉字    
  
支持。。。  
gb2312和gbk 的一个区别是 :gb2312 出来得比较早 ,所以有一些汉字和繁体好象不支持。gbk 是一个改进版。所以能用gbk的时候一般不用gb2312 

#12


utf-8>gbk>gb2312

#13


如果代码中出现汉字 UTF-8 不可保存!

#14


utf-8是jsp默认的,有中文时必需加入GBK/GB2312

#15


utf-8 gbk gb2312有什么区别?utf-8 gbk gb2312有什么区别?

#16


如果你编写的系统可能运行在英文(或者其他非中文)平台下,建议使用UTF-8,其国际化通用性较好。。
如果只是运行在中文平台下,使用GB2312或GBK(K是扩展的汉语拼音的第一个字母)。。
其中,GB2312是国家标准,GBK只是规范而已。。。

#17


学习一下~~

#18


进来学习下~~~

#19


明白了它们的区别了,谢谢

#20


gb2312编码集GBK编码的比较

gb2312编码简介
gb2312(又称为GB 2312-80)编码是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集·基本集》,又称为GB0,由中国国家标准总局发布,1981年5月1日实施。
更多详细介绍http://zh.wikipedia.org/zh-cn/Gb2312

GBK编码简介
GBK全名为汉字内码扩展规范,英文名Chinese Internal Code Specification。K 即是“扩展”所对应的汉语拼音(KuoZhan11)中“扩”字的声母。GBK 来自中国国家标准代码GB 13000.1-93。
更多详细介绍http://zh.wikipedia.org/zh-cn/GBK

GBK编码产生的原因
由于GB2312-80只收录了6763个汉字,有不少汉字,如部分在GB 2312-80推出以后才简化的汉字(如“啰”),部分人名用字(如中国前总理*的“镕”字),*及香港使用的繁体字,日语及朝鲜语汉字等,并未有收录在内。中文电脑开发商,于是利用了GB 2312-80未有使用的编码空间,收录了所有出现在Unicode 1.1及GB 13000.1-93之中的汉字,制定了GBK编码。

在实际的项目开发中,使用gb2312编码经常会造成部分人名无法正常显示,所以一般推荐使用GBK编码,比如:

<%@ page  pageEncoding="GBK"%>

from:http://www.darkmi.com/blog/archives/1042






#21


很好   又学习了一下下

#22


如果不设置编码的话,那默认的是什么呢





包装机

#23


引用 22 楼 packmarket 的回复:
如果不设置编码的话,那默认的是什么呢





包装机


会用操作系统默认的编码.

#24


3q,学习哈

#25


学习一下

#26


&#55369;学习了、、、学习学习学习布雷dafdasdfasddddd

#27


挺好的,来学习一下

#28


学习了 呵呵 很受教

#29


学习了

#30


学习了,明白了GBK、GB2312和UTF-8的区别了

#31


学习了 太好了  现在正好想理解一下  这方面的问题 听了大家说的  一下子感觉清醒了很多的

#32


又一次熟悉,多谢

#33


不错,学习了!

#34


个人认为gbk  gb2312完全没用,完全没必要去用这2个  撒都用utf-8  可以少操多少心