瀑布流的功能开发完了,感觉还不错,地址是:http://www.656463.com/waterfall,其中也有一些知识点,和大家分享一下。既然是瀑布流,就会涉及到图片,在这里我是获取本站文章中的图片,所以本节就是用jsoup获取文章中的图片
jsoup简单介绍
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
使用jsoup很简单,就是下载jar包,然后就能用里面的API进行解析了
中文地址是:http://www.open-open.com/jsoup/
下载jsoup地址:http://jsoup.org/download,最新版是jsoup-1.7.2.jar
获取文章图片
获取文章的图片,就是用jsoup在文章内容里解析出文章路径
- List<String> imgs = JsoupUtil.getImgSrc(article.getContent());
解析工具类
- /**
- * 解释HTML获取图片列表
- * @param html HTML内容
- * @return 图片列表
- */
- public static List<String> getImgSrc(String html){
- List<String> imgSrcs= new ArrayList<String>();
-
- Document doc = Jsoup.parse(html);
- Elements imgs = doc.getElementsByTag("img");
- for (Element img : imgs) {
- String imgSrc = img.attr("src");
- if(imgSrc!=null && imgSrc.trim().length()>0){
- imgSrcs.add(imgSrc);
- }
- }
-
- return imgSrcs;
- }
简单吧,就这样了
本文链接:用jsoup获取文章中的图片-瀑布流系列文章,由领悟书生原创
转载请注明出处【http://www.656463.com/article/348】