如果你有一个utf-8编码的文件,但是你想要一个其他编码的文件,比如GB2312,GBK,GB18030等等,如何转换呢?
通常的方法有一下两种:
[1]用文本编辑器,打开文件,再选择编码另存,就可以了
你可以用ultraedit,可以用textpad,可以用gedit,等等编辑工具
[2]用iconv工具
在linux下面,可以用
iconv工具来实现
比如我的文件
sample500.txt的编码是UTF-8
内容如下:
address
北京市东城区三眼井胡同乙68号
北京市东城区东中街22号
北京市东城区东中街29号东环广场B1层
北京市东城区东中街46号同厂子胡同46号
北京市东城区东交民巷
北京市东城区东交民巷1号
北京市东城区东交民巷2号北京新侨诺富特饭店
北京市东城区东内大街201号
转码 UTF-8 -> GB2312
$ head -10 sample500.txt | iconv -f UTF-8 -t GB2312 > sample.gb2312.txt
之后的文件内容是:
address
�����ж��������۾���ͬ��68�
�����ж��������н�22�
�����ж��������н�29�Ŷ����㳡B1�
�����ж��������н�46��ͬ���Ӻ�ͬ46�
����������������
�����������������1�
�����ж�������������2�ű�������ŵ���ط��
�����ж��������ڴ���201�
�����ж����������Ű�����ͬ23�
我的系统是乱码,是因为我的系统没有添加GB2312支持。
同样的道理,你也可以用这种方法来实现从一种编码到另一种编码的自由转换。
-f 是源文件的编码
-t是目标编码
详细的内容你可以参考iconv的帮助
注:我用的是debian 5.0 系统。
|----------------------------------------------------------------------------------------|
版权声明 版权所有 @zhyiwww
引用请注明来源 http://www.blogjava.net/zhyiwww
|----------------------------------------------------------------------------------------|
posted on 2009-06-19 17:40
zhyiwww 阅读(1331)
评论(0) 编辑 收藏 所属分类:
j2ee 、
debian