正则表达式基本规则
这里不介绍正则表达式的基本概念,而是对其规则进行一些整理。网上的分类大
多是按照类似的功能来划分,贪婪、非贪婪,前向,后向,乱七八糟的让人很混
乱。这里只列出最基本的15中规则。只要掌握这15条规则,认识这些“元字符”,
剩下的就是遇到具体的表达式进行具体的分析了。
一.
‘’有两种情况,如果后面紧跟的为,
1.) 元字符,或我称之为“正则符”,如’^’,’’,’$’等等。此时,其代
表的意义为“取消后面紧跟的正则符的特殊含义”。
2.) 其他字符,则’’和其紧跟的另一字符组成“正则符”。如’r’,’t’等比
较通用。其他组合,各软件的实现或许会有细微的差别。
二. []
含义是匹配中括号中的任意字符。
三. [^]
含义是匹配中括号中包含的字符以外的任意字符。
四. {}
一般可以写成这样:{m,n}。含义是匹配表达式前一个字符
最少m次,最多n次。
其中m或n也可以省略一个,比如,
{n},表示匹配前一个字符n次;
{m,},表示匹配前一个字符只是m次。
五. ()
含义是把括号中的表达式当成一个整体来匹配,同时也可以在以后作为一个独立
的表达式来引用。
六. ^
含义是匹配字符串的开始。
七. $
含义是匹配字符串的结尾。
八. ?
等于{0,1}。
九. +
等于{1,}。
十. *****
等于{0,}。
十一. .
含义是匹配除换行符以外的所以字符。
十二. |
含义是匹配前面的字符或表达式或是匹配后面的字符。
十三. a-z
含义是匹配所有小写的英文字符。
十四. A-Z
含义是匹配所有的大写的英文字符。
十五. 0-9
含义是匹配所有的数字。