C/C++,字符串的UTF-8与GBK(或GB2312)编码转换

时间:2022-03-20 14:07:48

转: C/C++,字符串的UTF-8与GBK(或GB2312)编码转换


写代码时经常会遇到各种编码转换问题,因此记录下来以便日后对各种平台下不同编码转换作整理。


C/C++:

GBK(或GB2312)转UTF-8实现:

[cpp]  view plain  copy
  1. string GBKToUTF8(const char* strGBK)  
  2. {  
  3.     int len = MultiByteToWideChar(CP_ACP, 0, strGBK, -1, NULL, 0);  
  4.     wchar_t* wstr = new wchar_t[len+1];  
  5.     memset(wstr, 0, len+1);  
  6.     MultiByteToWideChar(CP_ACP, 0, strGBK, -1, wstr, len);  
  7.     len = WideCharToMultiByte(CP_UTF8, 0, wstr, -1, NULL, 0, NULL, NULL);  
  8.     char* str = new char[len+1];  
  9.     memset(str, 0, len+1);  
  10.     WideCharToMultiByte(CP_UTF8, 0, wstr, -1, str, len, NULL, NULL);  
  11.     string strTemp = str;  
  12.     if(wstr) delete[] wstr;  
  13.     if(str) delete[] str;  
  14.     return strTemp;  
  15. }  

UTF-8转GBK(或GB2312)实现:

[cpp]  view plain  copy
  1. string UTF8ToGBK(const char* strUTF8)  
  2. {  
  3.     int len = MultiByteToWideChar(CP_UTF8, 0, strUTF8, -1, NULL, 0);  
  4.     wchar_t* wszGBK = new wchar_t[len+1];  
  5.     memset(wszGBK, 0, len*2+2);  
  6.     MultiByteToWideChar(CP_UTF8, 0, strUTF8, -1, wszGBK, len);  
  7.     len = WideCharToMultiByte(CP_ACP, 0, wszGBK, -1, NULL, 0, NULL, NULL);  
  8.     char* szGBK = new char[len+1];  
  9.     memset(szGBK, 0, len+1);  
  10.     WideCharToMultiByte(CP_ACP, 0, wszGBK, -1, szGBK, len, NULL, NULL);  
  11.     string strTemp(szGBK);  
  12.     if(wszGBK) delete[] wszGBK;  
  13.     if(szGBK) delete[] szGBK;  
  14.     return strTemp;  
  15. }