Dust Of Dream

知识真的是一个圆么?

Ruby学习笔记二:使用Ruby实现通过Proxy的方式请求网页

现在很多网站上某些活动都有限制同一IP只能投一票的规定,但是有时候迫于压迫,又不得不想办法多投几票,以前是采用Apache里的HttpClient来实现这些功能,日前正在看Ruby,就用它也来玩下:

require 'net/http'
##获得网页内容
def query_url(url)
return Net::HTTP.get(URI.parse(url));
end

#抓取cnproxy上所有的代理列表,并将结果保存到proxy.txt中去
#你可以修改这块代码或者其他的代理服务器列表
def find_all_proxy
z="3";j="4";r="2";l="9";c="0";x="5";i="7";a="6";p="8";s="1"
pf = File.new("proxy.txt","w+")
for page_no in 1..10
url = "http://www.cnproxy.com/proxy#{page_no}.html"
content = query_url(url)
#print content
## ^$?./\[]{}()+*
for array in content.scan(/<td>(.*?)<SCRIPT type=text\/javascript>document.write$":"\+(.*?)$<\/SCRIPT><\/td>/)
if array.length == 2
pf.write("#{array[0]}:#{eval(array[1])}\n")
end
end
end
pf.close
end

##处理请求
def open_url_with_proxy(url)
pf = File.open("proxy.txt","r")
d = []
pf.each { |line| d << line }
for var in d
print "User Proxy #{var}\n"
begin
proxy = Net::HTTP::Proxy(var.split(":")[0],var.split(":")[1].to_i)
print proxy.get(URI.parse(url));
#print proxy.start("www.google.com",80){|http|
# response = http.get('/index.html')
# puts response.body
#}
rescue
##吃掉异常
end
end
end

##主程序
begin
if !FileTest.exist?( "proxy.txt" )
find_all_proxy
end
open_url_with_proxy('http://www.google.com/index.html');
end

这里需要注意的是代理服务器的端口不能是String类型,Ruby竟然不会自动转换,搞得我浪费了N多时间.

posted on 2008-10-17 17:27 Anemone 阅读(1398) 评论(1) 编辑收藏所属分类: RUBY学习

Feedback

# re: Ruby学习笔记二:使用Ruby实现通过Proxy的方式请求网页 2008-10-18 01:09 爱吃鱼头

学习, 原来用java玩过这个,没想到用ruby写这么简洁~~
回复更多评论

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: Agile Web Development with Rails 3nd Edition 阅读笔记 Gem 从1.1 1.2 无法升级到1.3问题 Ror学习笔记 Ruby学习笔记二:使用Ruby实现通过Proxy的方式请求网页 Ruby学习笔记一:安装Ruby与Ruby的爬虫应用

My Links

Blog Stats

随笔 - 23
文章 - 0
评论 - 26
Trackbacks - 0

News

一直很懒，虽然工作5年了，却很少留下足迹。是时候需要改变了，欢迎大家去我的新博客逛逛。

Dust Of Dream

Ruby学习笔记二:使用Ruby实现通过Proxy的方式请求网页

Feedback

# re: Ruby学习笔记二:使用Ruby实现通过Proxy的方式请求网页 2008-10-18 01:09 爱吃鱼头

My Links

Blog Stats

News

常用链接

留言簿(1)

随笔分类

随笔档案

新闻档案

相册

常去网站

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜