规则表达式学习:
1.[] 定义class操作 {} 定义一个范围 () 定义一组
1>例如:[abc] 只含有a,b,c
2>例如:[^a]除了a之外任何字符
2.| 或者 && AND的意思 ? 0或1 可选的意思 + 0~* 0到多个 {n} 重复n次 {n,}至少n次 {n,m} n到m次
例如: a+b+ aaabb,abb,ab都符合
3.\b 分界线 \w 字母或者数字 $ 行结束 ^行开始
4.\d 0-9 \D ^0-9 \w 数字或字母 \W ^\w 非数字或字母 \t 即tab \n 回车 \s空格
5.\1 跟前面找到相同的一组
PRACTISE:
PATTERN 1: \b(\w+) \1\b
寻找一句话边界,接着跟一组文字或数字字符,接着跟一个空格,接着跟着跟前一个找到的完全相同一组文字或数字.
换言之,寻找重复语句
PATTERN 2: (
\\w+)(|_)(\\w+)@(\\w+)\\.com查找合理的EMAIL格式
cool_8056@163.com 或
cool8056@163.com都满足
PATTERN 3: hello*
hello ,helloo,helloooo都满足
PATTERN 4:
\\d{4}-\\d{8}