Java Blog for Alex Wan

Let life be beautiful like summer flowers and death like autumn leaves.

【Web Harvest】Web harvest获取XML出现乱码的解决办法

Web harvest获取XML出现乱码的解决办法：

现象：

在Web harvest中使用http请求去获取某个远程的XML，此XML的特征是无文件头(即没有编码描述等关键信息)，采用了多种办法去获取，出现乱码，无法解析成我们需要的数据。

办法：

(1)最原始办法：使用Java中的URLConnection，InputStream等类读取字节流，构造字符串：

Java代码

(2)最好的办法：直接使用dom4j中的SAXReader

Java代码

非常简单，连编码都不用管！

其中：link为需要获取XML的地址

Let life be beautiful like summer flowers and death like autumn leaves.

posted on 2009-02-17 15:13 Alexwan 阅读(2400) 评论(0) 编辑收藏所属分类: J2EE 、小笔记


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: [j2ee]linux下Activemq的部署和使用关闭MyEclipse6.0.1的Quick Update的方法 [cxf]CXF客户端配置文件之包含文件【Web Harvest】Web harvest获取XML出现乱码的解决办法 [CXF]CXF下的保护暴露在外的web service的方法及注意事项 [爬虫]网页分析的影响因素之专业化程度 [linux]linux下的脚本与java中的相对路径 [freemarcker]Expression JspTaglibs is undefined的解决办法 [eclipse]eclipse svn更换帐号的方法 [linux]linux下集成apache和tomcat时可能用到的命令