常用正则式

常用的数字正则（严格匹配）

正则含义

^[1-9]\d*$ 匹配正整数

^-[1-9]\d*$ 匹配负整数

^-?[1-9]\d*$ 匹配整数

^[1-9]\d*|0$ 匹配非负整数（正整数 + 0）

^-[1-9]\d*|0$ 匹配非正整数（负整数 + 0）

^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 匹配正浮点数

^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 匹配负浮点数

^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ 匹配浮点数

^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ 匹配非负浮点数（正浮点数 + 0）

^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ 匹配非正浮点数（负浮点数 + 0）

常用字符串正则

正则含义补充

^[A-Za-z]+$ 匹配由26个英文字母组成的字符串或 /^[a-z]+$/i

^[A-Z]+$ 匹配由26个英文字母的大写组成的字符串

^[a-z]+$ 匹配由26个英文字母的小写组成的字符串

^[A-Za-z0-9]+$ 匹配由数字和26个英文字母组成的字符串注意\w包含下划线_

^\w+$ 匹配由数字、26个英文字母或者下划线组成的字符串

匹配中文字符

普遍使用的正则是[\u4e00-\u9fa5]，但这个范围并不完整。例如：

/[\u4e00-\u9fa5]/.test( '⻏' ) // 测试部首⻏，返回false

根据Unicode 5.0版编码，要准确的判断一个中文字符要包括：

范围含义范围含义

2E80-2EFF CJK 部首补充 2F00-2FDF 康熙字典部首

3000-303F CJK 符号和标点 31C0-31EF CJK 笔画

3200-32FF 封闭式 CJK 文字和月份 3300-33FF CJK 兼容

3400-4DBF CJK 统一表意符号扩展 A 4DC0-4DFF 易经六十四卦符号

4E00-9FBF CJK 统一表意符号 F900-FAFF CJK 兼容象形文字

FE30-FE4F CJK 兼容形式 FF00-FFEF 全角ASCII、全角标点

因此，正确的匹配中文字符正则表达式为：

var rcjk = /[\u2E80-\u2EFF\u2F00-\u2FDF\u3000-\u303F\u31C0-\u31EF\u3200-\u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FBF\uF900-\uFAFF\uFE30-\uFE4F\uFF00-\uFFEF]+/g;

如果不希望匹配标点、符号，在正则中去掉对应的范围即可：

3000-303F CJK 符号和标点 FF00-FFEF 全角ASCII、全角标点

匹配双字节字符(包括汉字在内)

[^\x00-\xff]，可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1），代码示例如下：

console.info( "abc".replace( /[^\x00-\xff]/g,"aa" ).length ) // 3

console.info( "汉字".replace( /[^\x00-\xff]/g,"aa" ).length ) // 4

console.info( "abc汉字".replace( /[^\x00-\xff]/g,"aa").length ) // 7

posted on 2012-02-22 10:57 段旭阅读(268) 评论(0) 编辑收藏所属分类: JQuery

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: Jquery操作select 常用正则式 JQuery总体架构自调用匿名函数 self-invoking anonymous function jquery设置元素的readonly和disabled

adamduan

常用正则式

导航

常用链接

留言簿

随笔分类

随笔档案

搜索

最新评论

阅读排行榜

评论排行榜