获取文章中的图片

Posted on 2013-01-30 09:50 领悟书生 阅读(1968) 评论(1)  编辑  收藏

瀑布流的功能开发完了,感觉还不错,地址是:http://www.656463.com/waterfall,其中也有一些知识点,和大家分享一下。既然是瀑布流,就会涉及到图片,在这里我是获取本站文章中的图片,所以本节就是用jsoup获取文章中的图片

 

jsoup简单介绍

jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

使用jsoup很简单,就是下载jar包,然后就能用里面的API进行解析了

中文地址是:http://www.open-open.com/jsoup/

下载jsoup地址:http://jsoup.org/download,最新版是jsoup-1.7.2.jar

 

获取文章图片

获取文章的图片,就是用jsoup在文章内容里解析出文章路径

 

Java代码  收藏代码
  1. List<String> imgs = JsoupUtil.getImgSrc(article.getContent());  

 解析工具类

 

Java代码  收藏代码
  1. /** 
  2.  * 解释HTML获取图片列表 
  3.  * @param html HTML内容 
  4.  * @return 图片列表 
  5.  */  
  6. public static List<String> getImgSrc(String html){  
  7.     List<String> imgSrcs= new ArrayList<String>();  
  8.         
  9.     Document doc = Jsoup.parse(html);  
  10.     Elements imgs = doc.getElementsByTag("img");  
  11.     for (Element img : imgs) {  
  12.         String imgSrc = img.attr("src");  
  13.         if(imgSrc!=null && imgSrc.trim().length()>0){  
  14.             imgSrcs.add(imgSrc);  
  15.         }  
  16.     }  
  17.         
  18.     return imgSrcs;  
  19. }  

 简单吧,就这样了

 

本文链接:用jsoup获取文章中的图片-瀑布流系列文章,由领悟书生原创

转载请注明出处【http://www.656463.com/article/348】

Feedback

# re: 获取文章中的图片  回复  更多评论   

2013-01-30 16:38 by 免费网络记事本
GOOD,这个太棒了!!用于抓取别人的信息,很方便。也不用写正规则了,哈哈!

只有注册用户登录后才能发表评论。


网站导航: