看到很多文章在问和答关于java网页汉字乱码的情况,有些甚至认为这是servlet包容器实现上的错误。
可是如果读过servlet规格说明书,关于java网页编码的问题就应该迎刃而解了。
编写java网页(servlet\jsp),需要关心response(反馈给客户端的页面)和request(来自客户端的数据)的编码问题。
response的编码可以直接用代码实现。而request的编码怎么办呢?
以下是servlet规范书上的文字(我粗略翻译一下吧,不怕见笑):
-- 整理自<Java Servlet Specification Version 2.3> SRV.4.9 --
当前,很多浏览器并不发送带有“Content-Type”头信息的字符编码限定符,而由读取HTTP请求的代码来决定字符的编码方式。如果客户端请求未定义编码限定符,则包容器(如tomcat)用于创建request reader和分析POST数据的request的缺省编码方式必须是“ISO-8859-1”。然而,为了向开发者指明客户端没有发送字符编码信息的情况,包容器对getCharacterEncoding方法返回null。
如果客户端不设置字符编码方式,并且request不是按照以上缺省编码方式(iso-8859-1)来编码,则会发生问题。为了解决这个问题,在接口ServletRequest中加入了一个新的方法setCharacterEncoding(String enc)。开发者可以调用这个方法来替换包容器提供的缺省字符编码方式。但是,必须在从request中分析任何POST数据或者读取任何输入之前,调用这个方法。一旦数据已被读取,则调用这个方法将不会影响编码方式。