I wish you

今天, 你java了吗

  BlogJava :: 首页 :: 联系 :: 聚合  :: 管理
  17 Posts :: 19 Stories :: 8 Comments :: 0 Trackbacks

常用链接

留言簿(2)

我参与的团队

搜索

  •  

最新评论

阅读排行榜

评论排行榜

创建:
一个文本格式或正则表达式构造函数
文本格式: /pattern/flags

java的正则表达式构造函数: new RegExp("pattern"[,"flags"]);
参数说明:
pattern -- 一个正则表达式文本
flags -- 如果存在,将是以下值:
g: 全局匹配
i: 忽略大小写
gi: 以上组合

注意 文本格式的参数不用引号,而在用构造函数时的参数需要引号'/'。
如:/ab+c/i 和 new RegExp("ab+c","i")是实现一样的功能。

在构造函数中,一些特殊字符需要进行转意(在特殊字符前加"\")。
如:re = new RegExp("\\w+"), 表示要匹配 "\" 字符一次, "w"字符一次或者以上. 不过事实上, 在java里面, 特殊的"\" 字符也要写成 "\\", 所以代码类似:

    String msg = "\\w";
    Pattern p = Pattern.compile("\\w{2}");


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
正则表达式中的特殊字符

字符  含意
\        做为转意,即通常在"\"后面的字符不按原来意义解释,如/b/匹配字符"b",
         当b前面加了反斜杆后/\b/,转意为匹配一个单词的边界。
         例如: *  匹配它前面元字符0次或多次,/a*/将匹配a,aa,aaa,加了"\"后,/a\*/将只匹配"a*"。
         在java代码里面就是
            String msg = "aaabc";
            Pattern p = Pattern.compile("a*"); --结果为true
            Pattern p = Pattern.compile("a\*"); --结果为false 需要修正



^       匹配一个输入或一行的开头,/^a/匹配"an A",而不匹配"An a"
$      匹配一个输入或一行的结尾,/a$/匹配"An a",而不匹配"an A"
*       匹配前面元字符0次或多次,/ba*/将匹配b,ba,baa,baaa
+      匹配前面元字符1次或多次,/ba*/将匹配ba,baa,baaa
?      匹配前面元字符0次或1次,/ba*/将匹配b,ba
.       句点符号匹配所有字符(一个),包括空格、Tab字符甚至换行符。
(x)    匹配x保存x在名为$1...$9的变量中
()     分组,圆括号中的字符视为一个整体。
x|y    匹配x或y
{n}   精确匹配n次
{n,}  匹配n次以上
{n,m} 匹配n-m次
[xyz] 字符集(character set),匹配这个集合中的任一一个字符(或元字符)
[^xyz] 不匹配这个集合中的任何一个字符
[\b] 匹配一个退格符
\b 匹配一个单词的边界
\B 匹配一个单词的非边界
\cX 这儿,X是一个控制符,/\cM/匹配Ctrl-M
\d 匹配一个字数字符,/\d/ = /[0-9]/
\D 匹配一个非字数字符,/\D/ = /[^0-9]/
\n 匹配一个换行符
\r 匹配一个回车符
\s 匹配一个空白字符,包括\n,\r,\f,\t,\v等
\S 匹配一个非空白字符,等于/[^\n\f\r\t\v]/
\t 匹配一个制表符
\v 匹配一个重直制表符
\w 匹配一个可以组成单词的字符(alphanumeric,这是我的意译,含数字),包括下划线,如[\w]匹配"$5.98"中的5,等于[a-zA-Z0-9]
\W 匹配一个不可以组成单词的字符,如[\W]匹配"$5.98"中的$,等于[^a-zA-Z0-9]。


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
说了这么多了,我们来看一些正则表达式的实际应用的例子:

E-mail地址验证:
function test_email(strEmail) {
var myReg = /^[_a-z0-9]+@([_a-z0-9]+\.)+[a-z0-9]{2,3}$/;
if(myReg.test(strEmail)) return true;
return false;
}
HTML代码的屏蔽
function mask_HTMLCode(strInput) {
var myReg = /<(\w+)>/;
return strInput.replace(myReg, "<$1>");
}


其他的一些例子:

regEx

匹配

测试用str

(a|b){2}

aaabbbba

aabbfooaabfooabfoob

a[abc]b

aababbacb

3dfacb5ooyfo6abbfooaab

.

all string

3dfac

a.

aaax……等等

3dfacgg

d[^j]a

daad9a等等,除dja

3dfacggdjad5a

[d-g][ac]c

daceccgac

3dfacggggccad5c

[d-g].{2}c

d⊙⊙c……

3dfacggggccad5c

g{1,10}

gggg……

3dfacggggccad5c

[a|c][^a]

 

3dfacggggccad5c



测试用str

匹配

regEx

aabbfoaoabfooafobob

a⊙⊙b

a..b

aabbfoaaobfooafbob

ab、除aab

a[^a]b

gooooooogle

oooo……变成oo

o{2,20}

一本书中的“tan”“ten”“tin”“ton”

t.nt[aeio]n

abcaccbcbaacabccaa

删除acca

(ca)|(ac)

abccbcbaabca

再删除abba

结果ccbcca(如何与上面的合并)


正则表达式对象的属性及方法
  预定义的正则表达式拥有有以下静态属性:input, multiline, lastMatch, lastParen, leftContext, rightContext和$1到$9。
其中input和multiline可以预设置。其他属性的值在执行过exec或test方法后被根据不同条件赋以不同的值。
许多属性同时拥有长和短(perl风格)的两个名字,并且,这两个名字指向同一个值。(JavaScript模拟perl的正则表达式)

正则表达式对象的属性 属性 含义
$1...$9 如果它(们)存在,是匹配到的子串
$_ 参见input
$* 参见multiline
$& 参见lastMatch
$+ 参见lastParen
$` 参见leftContext
$’          参见rightContext
constructor    创建一个对象的一个特殊的函数原型
global       是否在整个串中匹配(bool型)
ignoreCase     匹配时是否忽略大小写(bool型)
input        被匹配的串
lastIndex     最后一次匹配的索引
lastParen     最后一个括号括起来的子串
leftContext    最近一次匹配以左的子串
multiline     是否进行多行匹配(bool型)
prototype     允许附加属性给对象
rightContext    最近一次匹配以右的子串
source       正则表达式模式
lastIndex     最后一次匹配的索引


正则表达式对象的方法
方法 含义
compile      正则表达式比较
exec        执行查找
test        进行匹配
toSource      返回特定对象的定义(literal representing),其值可用来创建一个新的对象。重载Object.toSource方法得到的。
toString      返回特定对象的串。重载Object.toString方法得到的。
valueOf      返回特定对象的原始值。重载Object.valueOf方法得到

例子
Smith, John
将输出"Smith, John"
posted by yxs


posted on 2006-04-06 10:16 Iwishyou 阅读(243) 评论(0)  编辑  收藏 所属分类: Java

只有注册用户登录后才能发表评论。


网站导航: