javaGrowing

BlogJava :: 首页 :: 新随笔 :: 联系 :: 聚合

:: 管理 ::

92 随笔 :: 33 文章 :: 49 评论 :: 0 Trackbacks

正则表达式

正则表达式是查找和替换文本模式的简洁和灵活的表示法。Visual Studio 中使用的正则表达式是 Visual C++ 6.0 中使用的、具有简化语法的表达式的超集。

在“查找”、“在文件中查找”或“在文件中替换”对话框中，可使用下列正则表达式来改进和扩展搜索。

注意在将下列任何表达式用作搜索条件的一部分之前，必须在“查找”、“在文件中查找”和“在文件中替换”对话框中选择“使用”复选框。

可使用下列表达式匹配搜索字符串中的字符或数字：

表达式	语法	说明
任一字符	.	匹配除换行符外的任何一个字符。
最多 0 项或更多	*	匹配前面表达式的 0 个或更多搜索项。
最多一项或更多	+	匹配前面表达式的至少一个搜索项。
最少 0 项或更多	@	匹配前面表达式的 0 个或更多搜索项，匹配尽可能少的字符。
最少一项或更多	#	匹配前面表达式的一个或更多搜索项，匹配尽可能少的字符。
重复 n 次	^n	匹配前面表达式的 n 个搜索项。例如，`[0-9]^4` 匹配任意 4 位数字的序列。
字符集	[]	匹配 [] 内的任何一个字符。要指定字符的范围，请列出由短划线 (-) 分隔的起始字符和结束字符，如 [a-z] 中所示。
不在字符集中的字符	[^...]	匹配跟在 ^ 之后的不在字符集中的任何字符。
行首	^	将匹配定位到行首。
行尾	$	将匹配定位到行尾。
词首	<	仅当词在文本中的此位置开始时才匹配。
词尾	>	仅当词在文本中的此位置结束时才匹配。
分组	()	将子表达式分组。
或	\|	匹配 OR 符号 (\|) 之前或之后的表达式。). 最常用在分组中。例如，`(sponge\|mud) bath` 匹配“sponge bath”和“mud bath”。
转义符	\	匹配跟在反斜杠 (\) 后的字符。这使您可以查找在正则表达式表示法中使用的字符，如 { 和 ^。例如，`\^` 搜索 ^ 字符。
带标记的表达式	{}	标记括号内的表达式所匹配的文本。
第 n 个带标记的文本	\n	在“查找”或“替换”表达式中，指示第 n 个带标记的表达式所匹配的文本，其中 n 是从 1 至 9 的数字。在“替换”表达式中，\0 插入整个匹配的文本。
右对齐字段	\(w,n)	在“替换”表达式中，将字段中第 n 个带标记的表达式右对齐至少 w 字符宽。
左对齐字段	\(-w,n)	在“替换”表达式中，将字段中第 n 个带标记的表达式左对齐至少 w 字符宽。
禁止匹配	~(X)	当 X 出现在表达式中的此位置时禁止匹配。例如，`real~(ity)` 匹配“realty”和“really”中的“real”，而不匹配“reality”中的“real”。
字母数字字符	:a	匹配表达式 ([a-zA-Z0-9])。
字母字符	:c	匹配表达式 ([a-zA-Z])。
十进制数	:d	匹配表达式 ([0-9])。
十六进制数	:h	匹配表达式 ([0-9a-fA-F]+)。
标识符	:i	匹配表达式 ([a-zA-Z_$][a-zA-Z0-9_$]*)。
有理数	:n	匹配表达式 (([0-9]+.[0-9])\| ([0-9].[0-9]+)\| ([0-9]+)).
带引号的字符串	:q	匹配表达式 (("[^"]")\| ('[^']'))
字母字符串	:w	匹配表达式 ([a-zA-Z]+)
十进制整数	:z	匹配表达式 ([0-9]+)。
转义符	\e	Unicode U+001B。
Bell	\g	Unicode U+0007。
退格符	\h	Unicode U+0008。
换行符	\n	匹配与平台无关的换行符。在“替换”表达式中，插入换行符。
制表符	\t	匹配制表符，Unicode U+0009。
Unicode 字符	\x#### 或 \u####	匹配 Unicode 值给定的字符，其中 #### 是十六进制数。可以用 ISO 10646 代码点或两个提供代理项对的值的 Unicode 代码点指定基本多语种平面（即一个代理项）外的字符。

下表列出按标准 Unicode 字符属性进行匹配的语法。两个字母的缩写词与 Unicode 字符属性数据库中所列的一样。可将这些指定为字符集的一部分。例如，表达式 [:Nd:Nl:No] 匹配任何种类的数字。

表达式	语法	说明
大写字母	:Lu	匹配任何一个大写字母。例如，`:Luhe` 匹配“The”但不匹配“the”。
小写字母	:Ll	匹配任何一个小写字母。例如，`:Llhe` 匹配“the”但不匹配“The”。
词首大写字母	:Lt	匹配将大写字母和小写字母结合的字符，例如，Nj 和 Dz。
修饰符字母	:Lm	匹配字母或标点符号，例如逗号、交叉重音符和双撇号，用于表示对前一字母的修饰。
其他字母	:Lo	匹配其他字母，如哥特体字母 ahsa。
十进制数	:Nd	匹配十进制数（如 0-9）和它们的双字节等效数。
字母数字	:Nl	匹配字母数字，例如罗马数字和表意数字零。
其他数字	:No	匹配其他数字，如旧斜体数字一。
开始标点符号	:Ps	匹配开始标点符号，例如左方括号和左大括号。
结束标点符号	:Pe	匹配结束标点符号，例如右方括号和右大括号。
左引号	:Pi	匹配左双引号。
右引号	:Pf	匹配单引号和右双引号。
破折号	:Pd	匹配破折号标记。
连接符号	:Pc	匹配下划线标记。
其他标点符号	:Po	匹配逗号 (,)、?、"、!、@、#、%、&、*、\、冒号 (:)、分号 (;)、' 和 /。
空白分隔符	:Zs	匹配空白。
行分隔符	:Zl	匹配 Unicode 字符 U+2028。
段落分隔符	:Zp	匹配 Unicode 字符 U+2029。
无间隔标记	:Mn	匹配无间隔标记。
组合标记	:Mc	匹配组合标记。
封闭标记	:Me	匹配封闭标记。
数学符号	:Sm	匹配 +、=、~、\| 、< 和 >。
货币符号	:Sc	匹配 $ 和其他货币符号。
修饰符号	:Sk	匹配修饰符号，如抑扬音、抑音符号和长音符号。
其他符号	:So	匹配其他符号，如版权符号、段落标记和度数符号。
其他控制	:Cc	匹配行尾。
其他格式	:Cf	格式化控制字符，例如双向控制字符。
代理项	:Cs	匹配代理项对的一半。
其他私用	:Co	匹配私用区域的任何字符。
其他未分配的字符	:Cn	匹配未映射到 Unicode 字符的字符。

除标准 Unicode 字符属性外，还可以指定下列附加属性。可将这些属性指定为字符集的一部分。

表达式	语法	说明
Alpha	:Al	匹配任何一个字符。例如，`:Alhe`匹配“The”、“then”、“reached”等单词。
数字	:Nu	匹配任何一个数或数字。
标点符号	:Pu	匹配任何一个标点符号，如 ?、@、' 等等。
空白	:Wh	匹配所有类型的空格，包括印刷和表意文字的空格。
Bidi	:Bi	匹配诸如阿拉伯文和希伯来文这类从右向左书写的字符。
朝鲜文	:Ha	匹配朝鲜文和组合朝鲜文字母。
平假名	:Hi	匹配平假名字符。
片假名	:Ka	匹配片假名字符。
表意文字/汉字/日文汉字	:Id	匹配表意文字字符，如汉字和日文汉字

posted @ 2005-12-06 10:02 javaGrowing 阅读(610) | 评论 (0) | 编辑收藏

Match a floating point number

^[-+]?(\d*(\.)?)\d+$

posted @ 2005-12-06 09:57 javaGrowing 阅读(295) | 评论 (1) | 编辑收藏

仅列出标题

javaGrowing

常用链接

留言簿(12)

随笔分类(84)

随笔档案(92)

文章分类(32)

文章档案(33)

相册

收藏夹(1)

ajax

java

java专家论坛

linux

Oracle

PHP

sap

xml

其他

好站链接

英语学习

软件下载

電子書

搜索

积分与排名

最新随笔

最新评论

阅读排行榜

评论排行榜