Krabber是用于抽取网页中HTML信息的工具。最为重要的是,Krabber可以执行网页中的JavaScript,并网页在JavaScript执行后的,被修改的HTML返回回来,提供给Java程序调用,以便能够更好的支持Web 2.0环境下的网页信息抓取。
啊列啊列,经过了超长时间的挣扎,终于做好了第一个可以运行的版本。参与项目开发的同学从对C++与Java完全不了解到逐渐的熟悉并开始进步,实在是相当不容易啊,赞一个。我本科的时候要是有这个水平,没准现在就牛X了。
比较惭愧的是,由于涉足开源领域的经验不足,没有很好的整理文档以及代码。目前Krabber已经可以下载了,可以尝试着在Windows下用VS编译一下,看看能不能行。另外可以运行的EXE也应该会快回上传上来。
另外昨天开会的时候同学们表示,我们小组的博客好像不太容易看懂。这个没办法啦,没有时间做网站和找主机,只能用博客充当在线内容编辑器了。大家在看我们的博客的时候请把它当成网站来看,相关的链接都在博客正文中黄色的标题下面,至于博客正文周边的连接就无视好了……
Krabber在http://www.blogjava.net/senior/archive/2009/05/10/269916.html
(by : 鸡叔 : senior, sakaekutitubasa@gmail.com)