正则入门30分钟笔记

作者:Dreamer
出处:http://www.dreamerlzy.com/blog/article/detail/regex
说明:本文版权归作者所有,欢迎转载,但未经作者同意时,请在文章页面明显位置给出原文链接,否则保留追究法律责任的权利。
参考: 正则表达式30分钟入门教程   

元字符

*   代表数量 它指定*前边的内容可以连续重复使用任意次以使整个表达式得到匹配

. 匹配除换行符以外的任意字符

\w 匹配字母或数字或下划线或汉字

\s 匹配任意的空白符

\d 匹配数字

\b 匹配单词的开始或结束 也就是单词的分界处 虽然通常英文的单词是由空格,标点符号或者换行来分隔的,但是并不匹配这些单词分隔字符中的任何一个,它只匹配一个位置。

^ 匹配字符串的开始

$ 匹配字符串的结束  处理多行的选项。如果选中了这个选项,^和$的意义就变成了匹配行的开始处和结束处。


元字符 反义

\W 匹配任意不是字母,数字,下划线,汉字的字符

\S 匹配任意不是空白符的字符

\D 匹配任意非数字的字符

\B 匹配不是单词开头或结束的位置

[^x] 匹配除了x以外的任意字符

[^aeiou] 匹配除了aeiou这几个字母以外的任意字符


分组


分类 代码/语法 说明

捕获 (exp) 匹配exp,并捕获文本到自动命名的组里

(?<name>exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)

(?:exp) 匹配exp,不捕获匹配的文本,也不给此分组分配组号

零宽断言 (?=exp) 匹配exp前面的位置

(?<=exp) 匹配exp后面的位置

(?!exp) 匹配后面跟的不是exp的位置

(?<!exp) 匹配前面不是exp的位置

注释 (?#comment) 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读



转义符

/

分支条件


重复

* 重复零次或更多次

+ 重复一次或更多次

? 重复零次或一次

{n} 重复n次

{n,} 重复n次或更多次

{n,m} 重复n到m次


懒惰限定符

*?    重复任意次,但尽可能少重复

+?    重复1次或更多次,但尽可能少重复

??    重复0次或1次,但尽可能少重复

{n,m}? 重复n到m次,但尽可能少重复

{n,}? 重复n次以上,但尽可能少重复





\b   元字符(metacharacter)  单词的分界处 匹配一个位置

.    元字符 匹配除了换行符以外的任意字符

*    元字符 数量 指代*签名的内容可以连续重复任意次 

\d   元字符 匹配一位数字

-    匹配自身

{N}  匹配N次

\s   任意空白符 空格 制表符(tab) 换行符 中文全角空格

\w   字母 数字 下划线 汉字

^    字符串开头

$    字符串结尾