正则表达式基本规则

这里不介绍正则表达式的基本概念,而是对其规则进行一些整理。网上的分类大
多是按照类似的功能来划分,贪婪、非贪婪,前向,后向,乱七八糟的让人很混
乱。这里只列出最基本的15中规则。只要掌握这15条规则,认识这些“元字符”,
剩下的就是遇到具体的表达式进行具体的分析了。

一.
‘’有两种情况,如果后面紧跟的为,
1.) 元字符,或我称之为“正则符”,如’^’,’’,’$’等等。此时,其代
表的意义为“取消后面紧跟的正则符的特殊含义”。
2.) 其他字符,则’’和其紧跟的另一字符组成“正则符”。如’r’,’t’等比
较通用。其他组合,各软件的实现或许会有细微的差别。

二. []
含义是匹配中括号中的任意字符。

三. [^]
含义是匹配中括号中包含的字符以外的任意字符。

四. {}
一般可以写成这样:{m,n}。含义是匹配表达式前一个字符
最少m次,最多n次。
其中m或n也可以省略一个,比如,
{n},表示匹配前一个字符n次;
{m,},表示匹配前一个字符只是m次。

五. ()
含义是把括号中的表达式当成一个整体来匹配,同时也可以在以后作为一个独立
的表达式来引用。

六. ^
含义是匹配字符串的开始。

七. $
含义是匹配字符串的结尾。

八. ?
等于{0,1}。

九. +
等于{1,}。

十. *****
等于{0,}。

十一. .
含义是匹配除换行符以外的所以字符。

十二. |
含义是匹配前面的字符或表达式或是匹配后面的字符。

十三. a-z
含义是匹配所有小写的英文字符。

十四. A-Z
含义是匹配所有的大写的英文字符。

十五. 0-9
含义是匹配所有的数字。