前两天朋友说用python做采集比较方便,有现成的包可以用。
今天查资料的时候看到ruby在数据处理和采集方面也有着较强的功能。
应用比较多的有
spridr
hpricot
nokogiri
http://nokogiri.org/
网页交互程序
Watir
http://bbs.locoy.com/archiver/tid-30408.html
http://www.tsnpc.com/use-watir-for-page-scraping/
Mechanize
http://www.javaeye.com/topic/299699
详细的以后应用到再去学习