天空
常用链接
我的随笔
我的评论
我的参与
最新评论
留言簿
(12)
给我留言
查看公开留言
查看私人留言
随笔分类
Database
(rss)
JSP(4)
(rss)
Linux(2)
(rss)
XML(5)
(rss)
其它(1)
(rss)
竞赛题(1)
(rss)
随笔档案
2006年9月 (2)
2006年7月 (2)
2006年6月 (3)
2006年4月 (5)
2006年3月 (6)
文章分类
Linux(1)
(rss)
.Net
.Net
华育国际
江南白衣
友情链接
搬家公司
讨债公司
搜索
最新评论
1. re: 使用 JTidy 协助抽取网页内容
你好,样式表怎么写呢?一点都不会,问题可能比较笨,拜托了急用。
--听海
2. re: 使用 JTidy 协助抽取网页内容
评论内容较长,点击标题查看
--jiangix11
3. re: 使用 Java 生成 MD5 编码[未登录]
fomat 字节为负数生成的结果对吗
--无名
4. re: VMware, Fedora 5 安装问题
你好我也遇到了No X Install Found的问题,能否发个vmware-config-tools.pl 给我。谢谢了
--wh8908
5. re: 字符编码的奥秘
不错
--lymin
阅读排行榜
1. 使用 Java 生成 MD5 编码(56294)
2. 使用 JTidy 协助抽取网页内容(7931)
3. 字符编码的奥秘(5582)
4. 详细介绍在tomcat中配置数据源以及数据源的原理 (3866)
5. 配制 eclipse 3.1 使用中文 JavaAPI (2555)
评论排行榜
1. 使用 JTidy 协助抽取网页内容(19)
2. 字符编码的奥秘(10)
3. 用于解析 sina 新闻页面的 XSLT 文件 (10)
4. 使用 Java 生成 MD5 编码(10)
5. 配制 eclipse 3.1 使用中文 JavaAPI (5)
Powered by:
博客园
模板提供:
沪江博客
BlogJava
|
首页
|
发新随笔
|
发新文章
|
联系
|
聚合
|
管理
03 2006 档案
用于解析 sina 新闻页面的 XSLT 文件
posted @
2006-03-20 21:29
haogj 阅读(1159) |
评论 (10)
编辑
poolman 学习笔记
posted @
2006-03-15 09:21
haogj 阅读(1335) |
评论 (0)
编辑
[转帖]XML 中的常见问题
posted @
2006-03-05 20:34
haogj 阅读(429) |
评论 (0)
编辑
Web 页面中的编码
posted @
2006-03-04 10:10
haogj 阅读(267) |
评论 (0)
编辑
XMLDOM 中 XML 编码识别
posted @
2006-03-04 10:08
haogj 阅读(385) |
评论 (0)
编辑
使用 JTidy 协助抽取网页内容
摘要: Tidy 是 W3C 用来解析网页的一个软件包,可以方便地将 HTML 文档转换为符合 XML 标准的文档,由于 XML 可以方便地使用 XSLT 技术对内容进行抽取,所以使用 Tidy 配合 XSLT 可以方便地将各种网页的内容抽取出来,保存成我们需要的格式。
阅读全文
posted @
2006-03-02 22:03
haogj 阅读(7931) |
评论 (19)
编辑