解决Servlet的乱码问题

时间:2023-02-10 09:55:59

在使用原生的Servlet进行web开发时,经常会遇到一些中文乱码问题。这儿简单总结一下:
造成乱码问题的原因只有一个:即客户端与服务端的字符编码不一致所导致。

服务器获取客户端传递过来的数据出现乱码的问题(即使用get获取post向服务器发送请求时出现乱码):

这里首先明确一下 get与post的乱码处理是不一致的,当get请求时,其传递给服务器的数据是附加在URL地址之后的;而post的请求时,其传递给服务器的数据是作为请求体的一部分传递给服务器。

post请求的乱码处理 :

用户在表单中填写的内容在http体中被提交给Servlet。当我们在表单中输入中文时,servlet的request的编码与客户端不一致,则服务器无法解析,则会出现乱码。解决方法是改变http请求体中的字符编码(对于get无效,因为get提交在请求头中)
改变http请求体中的字符编码为UTF8 : request.setCharacterEncoding(“UTF-8”);

解决get提交时的乱码方法一 :

URL的参数没有使用编码(即使用了ISO-8859-1等),则在服务器端获取get的参数的时候使用String一个可以指定编码的构造函数。

String username = request.getParameter("username");

String resultName = new String(username.getBytes("ISO-8859-1"),"utf-8");

解决get提交时的乱码方法二 :

有时提交的一些信息在地址栏显示的是“%2C%C6%CC%C6”的字样,其实这就是对URL进行了如下的编码。
java有两个类用来修改编码:
进行编码:URLEncoder.encode(String s,”UTF-8”)
进行解码:URLDecoder.decode(String s,”UTF-8”);
这样就可以得到传递过来的中文参数了,许多网站用的都是这种方式解决中参数的。
使用这个类把URL修改为:


http://127.0.0.1:8080/test?username=<%=URLEncoder.eccode("乱码","UTF8")%>

这样服务器获取username这个参数使用:

String username = URLDecoder.decode(request.getParameter("username"),"UTF8");

解决get提交时的乱码方法三 :修改Tomcat的编码

在上述的get请求所导致乱码问题中,还有一种解决的方案,我们常用Tomcat作为运行Servlet和JSP的容器,而Tomcat内部默认的编码是ISO-8859-1,所以对于get请求方式,其传递的数据(URI)会附加在访问的资源后面,其编码是Tomcat默认的,如果修改该URI的编码,那么对于所有的get请求方式便不会出现乱码了包括上边说的重定向和超链接,在Tomcat的配置文件server.xml中找到修改Tomcat的端口的地方,在其内部加入URIEncoding属性,设置为和你的项目中所设的编码一样的值,这里全部都是UTF-8。如下所示:

<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8" />

以上就是处理服务端获取客户端传递过来的数据出现乱码的问题:现在我们来看客户接受服务器响应的数据时出现乱码:

返回浏览器显示的乱码:
在Servlet编程中,经常需要通过response对象将一些信息返回给浏览器(response.getWriter().write(“xxx”)),给我们的客户端,而我们在服务器端显示的中文,但是响应给客户端浏览器却是乱码。这主要是由于response对象的getWriter()方法返回的PrintWriter对象默认使用“ISO-8859-1”字符集编码进行Unicode字符串到字节数组的转换,由于ISO8859-1字符集中根本就没有包含中文字符,所以Java在进行转换的时候会将无效的字符编码输出给客户端,于是便出现了乱码,为此ServletResponse接口中便定义了setCharacterEncoding、setContentType等方法来指定getWriter方法返回的PrintWriter对象所使用的字符集编码,所以我们在写Servlet程序中,在调用getWriter方法之前设置这些方法的值。我们为了防止乱码,经常将以下两条语句一起写上:

response.setContentType(“text/html;charset=utf-8”);
response. setCharacterEncoding(“UTF-8”);

只要编写Servlet文件中含有响应给客户端的信息,那么就要写上这两句话。最好写上第二句话,因为它的优先级高,它的设置结果将覆盖setContentType等方法设置的字符编码集。

通过Filter解决乱码问题:

在web.xml 文件中:

<filter>  
<filter-name>EncodingFilter</filter-name>
<filter-class>com.example.SysFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>UTF-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>EncodingFilter</filter-name>
<url-pattern>*.do</url-pattern>
</filter-mapping>

com.example.SysFilter类:

public class SysFilter implements Filter {   
protected String encodingName;

protected FilterConfig sysFilter;

public void destroy() {

}

public void doFilter(ServletRequest arg0, ServletResponse arg1,
FilterChain arg2) throws IOException, ServletException {
// TODO Auto-generated method stub
try {
arg0.setCharacterEncoding(this.sEncodingName);
arg1.setContentType("text/html;charset=" + this.sEncodingName);
arg1.setCharacterEncoding(this.sEncodingName);
arg2.doFilter(arg0, arg1);
} catch (Exception e) {
//....
} finally{
arg2.doFilter(arg0, arg1);
}
}

public void init(FilterConfig arg0) throws ServletException {
// TODO Auto-generated method stub
this.sysFilter = arg0;
this.sEncodingName = this.sysFilter.getInitParameter("encoding");
}
}