javaGrowing

语源科技BlogJava :: 首页 :: 新随笔 :: 联系 :: 聚合

:: 管理 ::

92 随笔 :: 33 文章 :: 49 评论 :: 0 Trackbacks

正则表达式

正则表达式是查找和替换文本模式的简洁和灵活的表示法。Visual Studio 中使用的正则表达式是 Visual C++ 6.0 中使用的、具有简化语法的表达式的超集。

在“查找”、“在文件中查找”或“在文件中替换”对话框中，可使用下列正则表达式来改进和扩展搜索。

注意在将下列任何表达式用作搜索条件的一部分之前，必须在“查找”、“在文件中查找”和“在文件中替换”对话框中选择“使用”复选框。

可使用下列表达式匹配搜索字符串中的字符或数字：

表达式	语法	说明
任一字符	.	匹配除换行符外的任何一个字符。
最多 0 项或更多	*	匹配前面表达式的 0 个或更多搜索项。
最多一项或更多	+	匹配前面表达式的至少一个搜索项。
最少 0 项或更多	@	匹配前面表达式的 0 个或更多搜索项，匹配尽可能少的字符。
最少一项或更多	#	匹配前面表达式的一个或更多搜索项，匹配尽可能少的字符。
重复 n 次	^n	匹配前面表达式的 n 个搜索项。例如，`[0-9]^4` 匹配任意 4 位数字的序列。
字符集	[]	匹配 [] 内的任何一个字符。要指定字符的范围，请列出由短划线 (-) 分隔的起始字符和结束字符，如 [a-z] 中所示。
不在字符集中的字符	[^...]	匹配跟在 ^ 之后的不在字符集中的任何字符。
行首	^	将匹配定位到行首。
行尾	$	将匹配定位到行尾。
词首	<	仅当词在文本中的此位置开始时才匹配。
词尾	>	仅当词在文本中的此位置结束时才匹配。
分组	()	将子表达式分组。
或	\|	匹配 OR 符号 (\|) 之前或之后的表达式。). 最常用在分组中。例如，`(sponge\|mud) bath` 匹配“sponge bath”和“mud bath”。
转义符	\	匹配跟在反斜杠 (\) 后的字符。这使您可以查找在正则表达式表示法中使用的字符，如 { 和 ^。例如，`\^` 搜索 ^ 字符。
带标记的表达式	{}	标记括号内的表达式所匹配的文本。
第 n 个带标记的文本	\n	在“查找”或“替换”表达式中，指示第 n 个带标记的表达式所匹配的文本，其中 n 是从 1 至 9 的数字。在“替换”表达式中，\0 插入整个匹配的文本。
右对齐字段	\(w,n)	在“替换”表达式中，将字段中第 n 个带标记的表达式右对齐至少 w 字符宽。
左对齐字段	\(-w,n)	在“替换”表达式中，将字段中第 n 个带标记的表达式左对齐至少 w 字符宽。
禁止匹配	~(X)	当 X 出现在表达式中的此位置时禁止匹配。例如，`real~(ity)` 匹配“realty”和“really”中的“real”，而不匹配“reality”中的“real”。
字母数字字符	:a	匹配表达式 ([a-zA-Z0-9])。
字母字符	:c	匹配表达式 ([a-zA-Z])。
十进制数	:d	匹配表达式 ([0-9])。
十六进制数	:h	匹配表达式 ([0-9a-fA-F]+)。
标识符	:i	匹配表达式 ([a-zA-Z_$][a-zA-Z0-9_$]*)。
有理数	:n	匹配表达式 (([0-9]+.[0-9])\| ([0-9].[0-9]+)\| ([0-9]+)).
带引号的字符串	:q	匹配表达式 (("[^"]")\| ('[^']'))
字母字符串	:w	匹配表达式 ([a-zA-Z]+)
十进制整数	:z	匹配表达式 ([0-9]+)。
转义符	\e	Unicode U+001B。
Bell	\g	Unicode U+0007。
退格符	\h	Unicode U+0008。
换行符	\n	匹配与平台无关的换行符。在“替换”表达式中，插入换行符。
制表符	\t	匹配制表符，Unicode U+0009。
Unicode 字符	\x#### 或 \u####	匹配 Unicode 值给定的字符，其中 #### 是十六进制数。可以用 ISO 10646 代码点或两个提供代理项对的值的 Unicode 代码点指定基本多语种平面（即一个代理项）外的字符。

下表列出按标准 Unicode 字符属性进行匹配的语法。两个字母的缩写词与 Unicode 字符属性数据库中所列的一样。可将这些指定为字符集的一部分。例如，表达式 [:Nd:Nl:No] 匹配任何种类的数字。

表达式	语法	说明
大写字母	:Lu	匹配任何一个大写字母。例如，`:Luhe` 匹配“The”但不匹配“the”。
小写字母	:Ll	匹配任何一个小写字母。例如，`:Llhe` 匹配“the”但不匹配“The”。
词首大写字母	:Lt	匹配将大写字母和小写字母结合的字符，例如，Nj 和 Dz。
修饰符字母	:Lm	匹配字母或标点符号，例如逗号、交叉重音符和双撇号，用于表示对前一字母的修饰。
其他字母	:Lo	匹配其他字母，如哥特体字母 ahsa。
十进制数	:Nd	匹配十进制数（如 0-9）和它们的双字节等效数。
字母数字	:Nl	匹配字母数字，例如罗马数字和表意数字零。
其他数字	:No	匹配其他数字，如旧斜体数字一。
开始标点符号	:Ps	匹配开始标点符号，例如左方括号和左大括号。
结束标点符号	:Pe	匹配结束标点符号，例如右方括号和右大括号。
左引号	:Pi	匹配左双引号。
右引号	:Pf	匹配单引号和右双引号。
破折号	:Pd	匹配破折号标记。
连接符号	:Pc	匹配下划线标记。
其他标点符号	:Po	匹配逗号 (,)、?、"、!、@、#、%、&、*、\、冒号 (:)、分号 (;)、' 和 /。
空白分隔符	:Zs	匹配空白。
行分隔符	:Zl	匹配 Unicode 字符 U+2028。
段落分隔符	:Zp	匹配 Unicode 字符 U+2029。
无间隔标记	:Mn	匹配无间隔标记。
组合标记	:Mc	匹配组合标记。
封闭标记	:Me	匹配封闭标记。
数学符号	:Sm	匹配 +、=、~、\| 、< 和 >。
货币符号	:Sc	匹配 $ 和其他货币符号。
修饰符号	:Sk	匹配修饰符号，如抑扬音、抑音符号和长音符号。
其他符号	:So	匹配其他符号，如版权符号、段落标记和度数符号。
其他控制	:Cc	匹配行尾。
其他格式	:Cf	格式化控制字符，例如双向控制字符。
代理项	:Cs	匹配代理项对的一半。
其他私用	:Co	匹配私用区域的任何字符。
其他未分配的字符	:Cn	匹配未映射到 Unicode 字符的字符。

除标准 Unicode 字符属性外，还可以指定下列附加属性。可将这些属性指定为字符集的一部分。

表达式	语法	说明
Alpha	:Al	匹配任何一个字符。例如，`:Alhe`匹配“The”、“then”、“reached”等单词。
数字	:Nu	匹配任何一个数或数字。
标点符号	:Pu	匹配任何一个标点符号，如 ?、@、' 等等。
空白	:Wh	匹配所有类型的空格，包括印刷和表意文字的空格。
Bidi	:Bi	匹配诸如阿拉伯文和希伯来文这类从右向左书写的字符。
朝鲜文	:Ha	匹配朝鲜文和组合朝鲜文字母。
平假名	:Hi	匹配平假名字符。
片假名	:Ka	匹配片假名字符。
表意文字/汉字/日文汉字	:Id	匹配表意文字字符，如汉字和日文汉字

posted on 2005-12-06 10:02 javaGrowing 阅读(648) 评论(0) 编辑收藏所属分类: 正则表达式

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: JAVA中正则表达式的应用（二） JAVA中正则表达式的应用 (一) 常用正则表达式正则表达式 Match a floating point number

javaGrowing

常用链接

留言簿(12)

随笔分类(84)

随笔档案(92)

文章分类(32)

文章档案(33)

相册

收藏夹(1)

ajax

java

java专家论坛

linux

Oracle

PHP

sap

xml

其他

好站链接

英语学习

软件下载

電子書

搜索

积分与排名

最新随笔

最新评论

阅读排行榜

评论排行榜