一. UTF-8和US-ASCII的区别
UTF-8 包括 US-ASCII 和多字节编码。与普通的多字节编码不同,UTF-8的字节长度不固定,对于ASCII, 字节长度为1, 对于中文,阿拉伯文等,可以是2,3或更多字节,这样能有效节省存储空间. 它还与很多传统编码标准兼容,所以很受欢迎.
二 native2ascii的使用
将本地码转为ASCII码的转换器。
将含有本地编码字符(既非 Latin1 又非 Unicode 字符)的文件转换为 Unicode 编码字符的文件。
1) 结构: native2ascii [options] [inputfile [outputfile]]
2) 说明
Java 编译器和其它 Java 工具只能处理含有 Latin-1 和/或 Unicode 编码(\udddd 记号)字符的文件。native2ascii
将含有其它字符编码的文件转换成含 Latin-1 和/或 Unicode 编码字符的文件。
若省略 outputfile
,则使用标准输出设备输出。此外,如果也省略 inputfile
,则使用标准输入设备输入。
3) 选项
-
-reverse
- 执行相反的操作:将含 Latin-1 和/或 Unicode 编码字符的文件转换成含本地编码字符的文件:
-
-encoding encoding_name
指定转换过程使用的编码名称。缺省的编码从系统属性 file.encoding
中得到。encoding_name 字符串必须是下表第一栏所示的字符串.
4) 使用举例
native2ascii -encoding GBK ApplicationResources_zh_CN.properties.gbk ApplicationResources_zh_CN.properties
posted on 2007-03-29 12:16
阿蜜果 阅读(9532)
评论(1) 编辑 收藏 所属分类:
Other