各位“蜘蛛侠”们大家可能在抓取页面中的验证码而耿耿于怀,关于这点我想我目前可能能帮助下大家,在python中找到最接近与“杀手级别”的工具(源于开源,报与开源,好东西不干独享)。
调下大家的积极性 ,上图
python 包>>
pytesser| http://code.google.com/p/pytesser/(其实 py包 使用很简单的,关键在安装)
1. 首先安装 pil : easy_install --find-links http://www.pythonware.com/products/pil/ Imaging
2. pytesser 依赖包
tesseract-ocr|
http://code.google.com/p/tesseract-ocr/
tesseract-ocr 依赖库|
http://tesseract-ocr.googlecode.com/files/tesseract-2.00.eng.tar.gz 解压到 你安装的 tesseract-ocr 的 识别学习库下
整理 www.blogjava.net/Good-Game