能实现整个网站的抓取,暂时还不支持javascript形式的连接
能抓取网页,网页中的所有的URL重新生成,图片,文件,包括所有格式的文件,全部都能保持原有的路径结构
抓取下的网页,通过apache搭建成网站,能在本地保持成一个完整的网站的形式
能直接使用,也能支持二次开发使用,不过暂时还会存在比较多的不完善的地方.
提供内置线程,能控制抓取操作执行的时间,循环执行
东西还不是很完善,欢迎大家提出意见
下载地址 http://www.blogjava.net/Files/snoics/snoics-reptile.rar
posted on 2006-02-10 09:20
snoics 阅读(2978)
评论(11) 编辑 收藏