我要啦免费统计

微蓝领域

我的学习档案馆
posts - 19, comments - 57, trackbacks - 0, articles - 57
  BlogJava :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理

JSP中文编码经验小结

Posted on 2007-08-24 11:25 hilor 阅读(562) 评论(0)  编辑  收藏
影响JSP编码的两个属性:contentType 和 pageEncoding ;

首先,我们先了解一下JSP的编码规则,从中可以理解到contentType和pageEncoding的作用域.
contentType的charset是指服务器发送给客户端时的内容编码.而pageEncoding是jsp文件本身的编码. 
 JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。
         第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。
        第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
        JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。
        第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效

contentType的設定.
         pageEncoding 和contentType的预设都是 ISO8859-1. 而随便设定了其中一个, 另一个就跟着一样了(TOMCAT4.1.27是如此). 但这不是绝对的, 这要看各自JSPC的处理方式. 而pageEncoding不等于contentType, 更有利亚洲区的文字 CJKV系JSP网页的开发和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。

从此我们可以看出,  pageEncoding影响的是JSP编绎成.java文件(即servlet文件)阶段,此时如果pageEncoding设定错了,用一般的编绎器编绎出来的.java文件中就会出现中文乱码. 而用eclipse的话会提示你编码错误..
contentType影响的是最后一个阶段,即由Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码(也就是.class文件)的阶段,我们在客户端看到的结果就是此阶段产生的,  这时的编码就是根据contentType来设定. 光从客户端来说,pageEncoding 和contentType设置的不一样,例pageEncoding=GB2312,contentType的charset=UTF-8,此时客户端显示的JSP页面都能够正常显示中文乱码. 

但是更重要的是与服务器的交互...   当从一个JSP页面发送请求至服务器端时, header中会发送什么数据呢?
header中发送的编码设定是由contentType指定的..  此时如果contentType指定的编码与服务器的编码不一致时,在服务器端就会产生中文乱码!

这是我经过多次实验得出的结果-_-|||  希望大家不会再为JSP的中文乱码问题头痛.. (统一编码为UTF-8是王道)

在开发J2EE WEB应用时最好使用过滤器来杜绝中文乱码的问题.  附过滤器源码:
import java.io.IOException;

import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;

public class SetCharacterEncodingFilter implements Filter {
 
private String encoding;
 
public void init(FilterConfig filterConfig) throws ServletException {
  
// TODO Auto-generated method stub
  this.encoding=filterConfig.getInitParameter("encoding");
 }


 
public void doFilter(ServletRequest request, ServletResponse response,
   FilterChain chain) 
throws IOException, ServletException {
  
// TODO Auto-generated method stub
  request.setCharacterEncoding(this.encoding);
  chain.doFilter(request,response);
 }


 
public void destroy() {
  
// TODO Auto-generated method stub

 }


}

在web.xml中添加以下代码:

  <filter>
   
<filter-name>SetCharacterEncodingFilter</filter-name>
   
<filter-class>org.hilor.servlet.SetCharacterEncodingFilter</filter-class>
   
<init-param>
    
<param-name>encoding</param-name>
    
<param-value>UTF-8</param-value>
   
</init-param>
  
</filter>

   
<filter-mapping>
   
<filter-name>SetCharacterEncodingFilter</filter-name>
   
<url-pattern>/*</url-pattern>  
  
</filter-mapping>
这样在所有的request请求的时候就会转换成UTF-8编码.

只有注册用户登录后才能发表评论。


网站导航: