linugb118--java space

Java

如何从网页中下载图片

如果做为爬虫很有必要从网页中下载图片到本地，那么我们利用jsoup来进行该操作，jsoup 是一个很不错的html解析器。

网页中下载图片需要这么两步操作

1.获取绝对路径

很多网页中用的是相对路径，因此获取图片的绝对路径很重要

方法一：我们就利用jsoup来获取

Element image = document.select("img").first();

String url = image.absUrl("src");

// url = http://www.example.com/images/chicken.jpg

或者

String url = image.attr("abs:src");

他们的前提利用connect方式获取而不是文件方式

Document doc = Jsoup.connect("http://jsoup.org").get();

Element link = doc.select("a").first();

String relHref = link.attr("href"); // == "/"

String absHref = link.attr("abs:href"); // "http://jsoup.org/"

方法二：利用jdk中url

URL url = new URL("http://www.example.com/index.html");

URI uri = url.toURI();

System.out.println(uri.resolve("images/chicken.jpg").toString());

2.第二步则就是下载图片

URL url = new URL( "图片地址");

URLConnection uc = url.openConnection();

InputStream is = uc.getInputStream();

File file = new File( "本地路径 ");

FileOutputStream out = new FileOutputStream(file);

int i=0;

while ((i=is.read())!=-1) {

out.write(i);

}

is.close();

posted on 2011-10-26 09:53 linugb118 阅读(2950) 评论(3) 编辑收藏

Feedback

# re: 如何从网页中下载图片 2011-10-26 13:54 如何买股票

恩不错！！支持一下！！回复更多评论

# re: 如何从网页中下载图片 2011-10-26 17:04 装B贩子

学习了回复更多评论

# re: 如何从网页中下载图片 2011-10-28 08:34 tb

不错学习一下回复更多评论

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理

linugb118--java space

如何从网页中下载图片

Feedback

# re: 如何从网页中下载图片 2011-10-26 13:54 如何买股票

# re: 如何从网页中下载图片 2011-10-26 17:04 装B贩子

# re: 如何从网页中下载图片 2011-10-28 08:34 tb

My Links

Blog Stats

常用链接

留言簿(1)

随笔档案

搜索

最新评论

阅读排行榜

评论排行榜