Change Dir

先知cd——热爱生活是一切艺术的开始

统计

留言簿(18)

积分与排名

“牛”们的博客

各个公司技术

我的链接

淘宝技术

阅读排行榜

评论排行榜

11 2011 档案

工具包系列(2):imageSpider工具——可定制的图像抓取
     摘要: 这个工具是一个可定制的图像抓取工具

我希望这个小工具的功能点有以下几项:1.给定页面抓取页面的图片;2.给定页面和过滤规则,抓取页面的图片并存到本地磁盘或内存;

主要的技术点不多:1.图片链接的获取(htmlparser搞定);2.图片的读写(imageIo搞定);3.规则的制定(来源于需求)

介于方法的多样,第一个版本的spider只是很简单的功能实现,未来希望加入的就是可扩展的规则对象

少废话,上代码:
  阅读全文

posted @ 2011-11-02 15:43 changedi 阅读(2049) | 评论 (1)  编辑