Posted on 2008-04-10 00:18
xan 阅读(144)
评论(0) 编辑 收藏 所属分类:
C/C++ & MS stuff
regexp很好很强大,不过一时半会没时间看,不过总是要看的,先从.net用到的开始吧~
从网页源码中分析出 类似于 href=["|'] www.cc98.org/shop/index.asp["|'] 的东西
string pattern = "<a[^><]* href [\\s]* = [\\s]* ["|']? (?<urltext>([^\"'><\\s]+)) ["|']? [^>]* >"
Regex=new Regex(pattern,...)
请无视空格,没有任何含义,只是方便阅读.
以<a >为界, 我觉得应该要有明确的界,才能保证匹配速度.
VS的帮助文档中有这些内容,花个2小时静心看看,便知了