request中文乱码和response中文乱码问题

时间:2023-02-02 18:23:35

http请求和响应中,有时候我们接收到http请求做处理时发现从request获取的中午数据是乱码,还有的时候通过response输出中文数据到浏览器时也是中文乱码,这里网上整合了一些资料,都是比较好的


一、request接收的参数中文乱码:


乱码原因:Http请求传输时将url以ISO-8859-1编码,服务器收到字节流后默认会以ISO-8859-1编码来解码成字符流(造成中文乱码)

post请求:

假设提交请求的jsp页面是UTF-8编码

<%@ page language="Java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>

解决方法1:在服务端获取参数前,先设置解码方式。

[java] view plain copy
  1. //设置解码方式,对于简体中文,使用UTF-8解码  
  2. request.setCharacterEncoding("UTF-8");  
  3. request.getParameter("参数名");  


解决方法2:Tomcat默认编码ISO8859-1,设置成其他的编码



[java] view plain copy
  1. <Connector port="8080" protocol="HTTP/1.1"     
  2.     connectionTimeout="20000"     
  3.     redirectPort="8444"     
  4.     useBodyEncodingForURI="true" URIEncoding="UTF-8"/>    

重点在 userBodyEncodingForURI 和 URIEncoding 这两个属性

下面来解释一下这两个属性的意义

useBodyEncodingForURI参数表示是否用request.setCharacterEncoding参数对URL提交的数据和表单中GET方式提交的数据进行重新编码,在默认情况下,该参数为false。

URIEncoding参数指定对所有GET方式请求进行统一的重新编码(解码)的编码。

URIEncoding和useBodyEncodingForURI区别是,

URIEncoding是对所有GET方式的请求的数据进行统一的重新编码,

而useBodyEncodingForURI则是根据响应该请求的页面的request.setCharacterEncoding参数对数据进行的重新编码,不同的页面可以有不同的重新编码的编码

解决方法3:通过字符串和字节流转换时使用正确的编码获取中文参数

[java] view plain copy
  1. String str = new String(request.getParameter("参数名").getBytes("iso-8859-1"), "utf-8");   

get请求:

对于get请求,上面针对于post的请求的三种解决方法,只有第三种可以用,第一种和第二种并没有效果,这和tomcat的内部机制有关。
对于get请求,还有一个很笨拙的方法,不推荐使用,贴出来,以供了解:

[java] view plain copy
  1. /获取请求里包含的查询字符串  
  2. String rawQueryStr = request.getQueryString();  
  3. out.println("原始查询字符串为:" + rawQueryStr + "<hr/>");  
  4. //使用URLDecoder解码字符串  
  5. String queryStr = java.net.URLDecoder.decode(  
  6.     rawQueryStr , "gbk");  
  7. out.println("解码后的查询字符串为:" + queryStr + "<hr/>");  
  8. //以&符号分解查询字符串  
  9. String[] paramPairs = queryStr.split("&");  
  10. for(String paramPair : paramPairs)  
  11. {  
  12.     out.println("每个请求参数名、值对为:" + paramPair + "<br/>");  
  13.     //以=来分解请求参数名和值  
  14.     String[] nameValue = paramPair.split("=");  
  15.     out.println(nameValue[0] + "参数的值是:" +   
  16.         nameValue[1]+ "<hr/>");  
  17. }  




[java] view plain copy
  1. </pre><p></p><p><span style="color:rgb(56,56,56); font-family:"Trebuchet MS",Helvetica,"Microsoft YaHei",Georgia,sans-serif; font-size:13px; line-height:23px">乱码原因:Http请求传输时将url以ISO-8859-1编码,服务器收到字节流后默认会以ISO-8859-1编码来解码成字符流(造成中文乱码)</span></p><p><span style="font-family:Trebuchet MS,Helvetica,Microsoft YaHei,Georgia,sans-serif; color:#383838"><span style="font-size:13px; line-height:23px">post请求:</span></span></p><p><span style="font-family:Trebuchet MS,Helvetica,Microsoft YaHei,Georgia,sans-serif; color:#383838"><span style="font-size:13px; line-height:23px">假设提交请求的jsp页面是UTF-8编码</span></span></p><p><span style="font-family:Trebuchet MS,Helvetica,Microsoft YaHei,Georgia,sans-serif; color:#383838"><span style="font-size:13px; line-height:23px"><%@ page language="java" contentType="text/html; charset=UTF-8"    pageEncoding="UTF-8"%></span></span></p><p><span style="font-family:Trebuchet MS,Helvetica,Microsoft YaHei,Georgia,sans-serif; color:#383838"><span style="font-size:13px; line-height:23px">解决方法1:在服务端获取参数前,先设置解码方式。</span></span></p><p><span style="font-family:Trebuchet MS,Helvetica,Microsoft YaHei,Georgia,sans-serif; color:#383838"><span style="font-size:13px; line-height:23px"></span></span></p><pre name="code" class="java" style="color: rgb(56, 56, 56); font-size: 13px; line-height: 23px;">//设置解码方式,对于简体中文,使用UTF-8解码  
  2. request.setCharacterEncoding("UTF-8");  
[java] view plain copy
  1. request.getParameter("参数名"); 



二、response返回的数据中文乱码:

首先,response返回有两种,一种是字节流outputstream,一种是字符流printwrite。

申明:这里为了方便起见,所有输出都统一用UTF-8编码。

先说字节流,要输出“中国",给输出流的必须是转换为utf-8的“中国”,还要告诉浏览器,用utf8来解析数据

 

  1.        //这句话的意思,是让浏览器用utf8来解析返回的数据  
  2.         response.setHeader("Content-type", "text/html;charset=UTF-8");  
  3.         String data = "中国";  
  4.         OutputStream ps = response.getOutputStream();  
  5.         //这句话的意思,使得放入流的数据是utf8格式  
  6.         ps.write(data.getBytes("UTF-8")); 

 

再说字符流,要输出中国,需要设置response.setCharacterEncoding("UTF-8");

 

  1.              //这句话的意思,是让浏览器用utf8来解析返回的数据  
  2. response.setHeader("Content-type", "text/html;charset=UTF-8");  
  3. //这句话的意思,是告诉servlet用UTF-8转码,而不是用默认的ISO8859  
  4. response.setCharacterEncoding("UTF-8");  
  5. String data = "中国";  
  6. PrintWriter pw = response.getWriter();  
  7. pw.write(data);