花

即使世界明天毁灭，我也要在今天种下我的葡萄树。

posts - 112, comments - 14, trackbacks - 0, articles - 11

JAVA编码问题的一些理解

Posted on 2006-04-30 10:18 花阅读(101) 评论(0) 编辑收藏

Java 语言默认的编码方式是UNICODE ，而我们中国人通常使用的文件和数据库都是基于 GB2312 或者 BIG5 等方式编码的，怎样才能够恰当地选择汉字编码方式并正确地处理汉字的编码呢？本文将从汉字编码的常识入手，结合 Java 编程实例，分析以上两个问题并提出解决它们的方案：

1．在JSP程序中加入一条语句：
<%@page contentType="text/html;charset=gb2312" %>

2．在URL请示字符串的编码问题。
如果通过GET/POST方法从客户端传递过来的信息中包含汉字信息，SERVLET/JSP无法得到正确的值。
我们在调用request.getParameter("param_name")前指定应用程序所希望的编码方式。
也就是request.setCharacterEcoding()即可

3．在不同的平台编码的问题是不同的。
在linux平台上的标准是Iso8859_1,而在win2k下是GBK的，这些是默认的标准，如果你的服务器不是这样的，那么编译的问题一定会有问题。本人就遇到这样的问题，两台LINUX服务器，一台lang=en，一台lang=en,UTF8,被我搞了N长时间才找到原因。

3．我本人用的最多的转换编码的一个类（在linux平台），几乎可以解决所有的编码问题。类的方法非常解决。主要就是asc2gb()和gb2asc()这两个类。
package com.whaic.tools;

import java.io.UnsupportedEncodingException;

public class ECov
{
public static String asc2gb(String asc){
String ret;

if(asc==null)return asc;
try{
ret=new String(asc.getBytes("ISO8859_1"),"GB2312");
}
catch(UnsupportedEncodingException e){
ret=asc;
}
return ret;
}

public static String gb2asc(String gb){
String ret;
if(gb==null)return gb;
try{
ret=new String(gb.getBytes("GB2312"),"ISO8859_1");
}
catch(UnsupportedEncodingException e){
ret=gb;
}
return ret;
}
}

4．读写文件时的中文问题：

Read::

FileInputStream fis = new FileInputStream(strInFile);

InputStreamReader isr = new InputStreamReader(fis, "GB2312");

Reader in = new BufferedReader(isr);

int ch;

while ((ch = in.read()) > -1) {

iCharNum += 1;

buffer.append((char)ch);

}

in.close();

Write::

FileOutputStream fos = new FileOutputStream(strOutFile);

Writer out = new OutputStreamWriter(fos, "Big5");

out.write(str);

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理

花

导航

常用链接

留言簿(2)

随笔分类(59)

随笔档案(112)

文章分类(3)

文章档案(11)

相册

XML link

最新随笔

搜索

最新评论

JAVA编码问题的一些理解