关于特殊字符的一些总结

最近做一个项目，里面很多特殊字符，引发了一些问题，解决后很开心，特别来分享。
特殊字符：
Jörg Ranau
Sigutė Jakštonytė
Côte d'Ivoire

数据库手工导入数据

先检查数据库的字符集和客户端字符集是否一致。采用的是UTF8 查看语句：
select * from nls_database_parameters
若是采用DOS 下的SQLPLUS 导入数据，需要
set NLS_LANG=AMERICAN_AMERICA.UTF8
windows: set NLS_LANG=AMERICAN_AMERICA.UTF8
unix: NLS_LANG=AMERICAN_AMERICA.UTF8
检查导入的数据的文件格式，格式采用： UTF8 without BOM,
可以用NOTEPAD++, CONVER TO UTF8 without BOM
也可以用txt , 转换成UTF8.
第3点非常重要，之前忽略了，发现插入导入数据库后，数据显示不对。验证你导入的数据是否正确可以用ORACLE DUMP 命令。
select dump(country_desc),country_desc from tb_test where testcode='1';
Typ=1 Len=14: 67,195,180,116,101,32,100,39,73,118,111,105,114,101 Côte d'Ivoie

数据库脚本中遇到特殊字符：

单引号‘ ， oracle 脚本需要写成两个单引号
特殊字符&， oracle 表示需要的参数，若是数据中有这个有2个方法：
第1 种：
set define off;
第2种：
set escape on;

然后将所有的&，替换成/&。
空行
用<br> 代替。

JAVA 代码导入数据：

要导入的数据都放在TXT 类型的文件里，通过batch job 导入数据库。
检查导入的数据的文件格式，格式采用： UTF8 without BOM, 可以用NOTEPAD++, CONVER TO UTF8 without BOM

java 代码：

1：读文件

InputStreamReader read = new InputStreamReader (new FileInputStream(file),"UTF-8");

BufferedReader inBuf=new BufferedReader(read);

2：检查所用开发工具的文件ENCODING 字符。

这个就是会为什么导致没发现：
读文件错误，在开发工具中打出的LOG 欺骗了我们的眼睛。我的开发工具BEA 里JAVA 文件默认ENCODING cp1252, 改成UTF8 就好了。

这个特别容易忽略，当在控制台看LOG的时候，发现读过来的文件里的内容打出来都正确，就忽略了JAVA的源文件。认为是从unicode转换 utf8 有问题，特别将字符又做了处理，发现插入数据库还是不正确。

修改了ENCODING 字符字符后发现读入文件就不对了。这样轻松就解决了。

所以只要修改了读文件的时候采用 UTF8格式就可以啦。

posted on 2011-05-22 11:28 paulwong 阅读(300) 评论(0) 编辑收藏所属分类: J2EE

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: RESTful API 设计指南 WEB版的REST测试工具 maven3 jetty jrebel 搭建可调式的开发环境分布式配置管理平台Disconf JAVAEE资源分布式调度QUARTZ+SPRING Spring对HttpSession的重新封闭转（探讨分布式系统与集群的区别）整合测试 Java EE 应用开发平台 Koala

paulwong

My Links

Blog Stats

常用链接

留言簿(65)

随笔分类(1374)

随笔档案(1133)

文章分类(7)

文章档案(10)

相册

收藏夹(2)

AI

Develop

E-BOOK

Other

养生

微服务

搜索

最新评论

阅读排行榜

评论排行榜

60天内阅读排行

关于特殊字符的一些总结