关于java的乱码,一直是双字节字符环境开发者的问题,不同的服务,不同的版本,甚至不同的系统环境,都有很大的影响。
今天说一下,在中文windows下,Tomcat5.5服务下的,UTF-8的乱码解决问题。
首先要需要了解的是web容器默认编码是iso-8859-1,一个汉字占用两个字节,而在utf-8中一个汉字占用三个字节。所以在数据传递过程中,必须手动设定容器编码格式,否则会出现字符位丢失的情况。即3个字节变为两个字节,自然会变成乱码。
其次,Tomcat 5以后,对post和get方法的编码控制分开了,像以前那样,仅仅
request.setCharacterEncoding("utf-8");
response.setCharacterEncoding("utf-8");
不能解决问题了。
明白了这个以后,再来看
第一步,修改tomcat。
找到对应站点的server.xml后,在里面的Connector标签里面添加
useBodyEncodingForURI="true"
这句的话告诉tomcat用页面的编码去处理post,推荐使用。
这块有句更狠的就是
URIEncoding="utf-8"
不过是强制指定编码了,所以一旦有其他编码的页面存在,就会出问题,所以不建议用。
第二步,修改jsp页面头。
我是偷懒,全都加上了
<%@ page language="java" pageEncoding="UTF-8"%>
,然后在html标签的head标签里加上
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
第三步,修改指定编码。
在jsp头部分,任何request和response被使用前,加上
request.setCharacterEncoding("utf-8");
response.setCharacterEncoding("utf-8");
经过以上三步后,post过来的文字就可以正常的用request.getParameter()取得并使用了。
第四步,修改用get方法传出的连接参数。
new String(java.net.URLEncoder.encode("输入文字","UTF-8"));
记得try一下,我是封装的一下用的。
经过以上几步,基本上乱码的问题解决了。
posted on 2009-05-18 10:21
sw0rd 阅读(9114)
评论(0) 编辑 收藏