java 处理乱码三种方式

时间:2024-05-22 20:15:22

一.概述

     在做javaWeb项目的过程中,前端提交的数据到后台,难免会遇到乱码问题,那么乱码问题是如何产生的呢?

     由于浏览器和服务器都是国外人最早开发,规范也是国外定的,无论是浏览器还是服务器的默认编码都是拉丁ISO-8859-1,在欧美国家都支持,因此浏览器在把前端数据编码后,通过二进制流传输到后台,服务器(tomcat)接收,以ISO-8859-1的方式进行解码,就没有任何问题,当中文出现后,一个中文汉子可能是三个字节或者两个字节,那么用ISO-8859-1编码就会把一个汉子切割成1/2或者1/3,出现乱码问题。

   为了解决这个问题,开始出现了GBK编码解码方式,专门应对中文。问题就解决了。但是假如出现韩文,日文,中东等其他各种文字,怎么办呢,国际相关组织就一起制定了UTF-8,支持世界上所有的文字编码和解码的问题,俗称万维码。

二.解决方式1(若乱码参数多,就比较低效)

   浏览器默认编码为ISO-8859-1,后端Servlet接收请求参数,按照ISO-8859-1进行解码,得到二进制流,然后再用UTF-8编码。

   示例代码:        
        // 获得请求参数
        String queryString = request.getQueryString();
        // 按照ISO-8859-1方式解码
        byte[] bytes = queryString.getBytes("ISO-8859-1");
        // 按照UTF-8编码
        String param = new String(bytes,"UTF-8");

三.解决方式2(此种方式只支持get方式请求)

 修改服务器(tomcat)配置:在server.xml中,默认为ISO-8859-1(没有显示出来),我们可以添加上UTF-8

java 处理乱码三种方式

  四.解决方式3(此种方式只支持post方式请求)

     在servlet直接设置请求参数编码--推荐

      //设置请求参数编码 

      request.setCharacterEncoding("UTF-8");

五.如果post和get同时出现乱码,结合方式2和方式三使用

六.响应乱码--响应

         // 设置MIME类型
        response.setContentType("text/html");
        // 设置编码
        response.setCharacterEncoding("UTF-8");

          //设置编码(简写)
          response.setContentType("text/html;charset=utf-8");