kooyee ‘s blog

开源软件，众人努力的结晶，全人类的共同财富

posts - 103, comments - 55, trackbacks - 0, articles - 66

:: 首页 :: 新随笔 :: 联系 :: 聚合

:: 管理

【转】让我的C++程序直接阅读网页

Posted on 2008-07-03 15:31 kooyee 阅读(753) 评论(1) 编辑收藏所属分类: C/C++

为了使我的程序能够不依赖浏览器，直接从感兴趣Web网页中抽取信息，
又感到现有的一些库或解析器庞大而不方便，于是基于pull的方式写了
一组实用的HTML解析函数。这样就可以摆脱浏览器，让自编的软件方便
地阅读Web网页。

经过几年来的使用，发现能够用于不少用途，如 Yahoo登录，寻找股票
保价，浏览各种论坛等等。

为了能有机会与有同样需要和兴趣的编程爱好者共同讨论提高，我将
陆续贴出这组解析HTML文档的实用C函数，如下列表:

void
canonHTML( string & htmltext )
规范化HTML文档

void
getHTMLLink( string & obj_url,
const string & htmltext,
UInt32 index,
const string & name )
获取超链接的地址

void
getHTMLObject( string & obj,
const string & htmltext,
const string & tag,
UInt32 tagindex,
UInt32 unpair )
获取某个tag的内容，含tag本身

void
getHTMLObjectText( string & obj,
const string & htmltext,
const string & tag,
UInt32 tagindex,
UInt32 unpair )
获取某个tag的内容，不含tag

2008-07-20 22:07 by 开发者论坛

www.keefa.cn开发者论坛,软件开发,编程学习,电脑技术交流欢迎大家来一起交流学习