正则入门30分钟笔记
作者:Dreamer
出处:http://www.dreamerlzy.com/blog/article/detail/regex
说明:本文版权归作者所有,欢迎转载,但未经作者同意时,请在文章页面明显位置给出原文链接,否则保留追究法律责任的权利。
参考:
正则表达式30分钟入门教程
元字符
* 代表数量 它指定*前边的内容可以连续重复使用任意次以使整个表达式得到匹配
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束 也就是单词的分界处 虽然通常英文的单词是由空格,标点符号或者换行来分隔的,但是并不匹配这些单词分隔字符中的任何一个,它只匹配一个位置。
^ 匹配字符串的开始
$ 匹配字符串的结束 处理多行的选项。如果选中了这个选项,^和$的意义就变成了匹配行的开始处和结束处。
元字符 反义
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
分组
分类 代码/语法 说明
捕获 (exp) 匹配exp,并捕获文本到自动命名的组里
(?<name>exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)
(?:exp) 匹配exp,不捕获匹配的文本,也不给此分组分配组号
零宽断言 (?=exp) 匹配exp前面的位置
(?<=exp) 匹配exp后面的位置
(?!exp) 匹配后面跟的不是exp的位置
(?<!exp) 匹配前面不是exp的位置
注释 (?#comment) 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读
转义符
/
分支条件
|
重复
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
懒惰限定符
*? 重复任意次,但尽可能少重复
+? 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复
\b 元字符(metacharacter) 单词的分界处 匹配一个位置
. 元字符 匹配除了换行符以外的任意字符
* 元字符 数量 指代*签名的内容可以连续重复任意次
\d 元字符 匹配一位数字
- 匹配自身
{N} 匹配N次
\s 任意空白符 空格 制表符(tab) 换行符 中文全角空格
\w 字母 数字 下划线 汉字
^ 字符串开头
$ 字符串结尾