外观
regular expression
471字约2分钟
2020-09-06
用途
- 文本查找
- 文本替换
组成
- 正则表达式分为:普通字符+元字符
- 元字符按打印方式分为:非打印字符+特殊字符
- 元字符按作用类型分为: 限定符+定位符
普通字符
- 没有标记为元字符的所有可打印字符(字母、数字、标点...)
非打印字符
\cx:匹配x指明的控制字符
\f:匹配换页符
\n:匹配换行符
\r: 匹配回车符
\s:匹配任何空白字符
\S:匹配任何非空白字符
\t:匹配制表符
\v:匹配垂直制表符特殊字符
$:匹配字符串的结尾
^ :匹配字符串开始位置
():匹配一个子表达式的开始和结束
[ :标记中括号表达式开始
{:标记限定符表达式开始
*:匹配前面的子表达式0次或多次
+:匹配前面的子表达式1次或多次
.:匹配换行符之外的任何字符
?:匹配前面表达式0次或1次
|:指明两项之间选择
\:将后一个字符标记为(特殊字符、原义字符、向后引用、八进制转义)限定符
*:匹配前面子表达式0次或多次
+:匹配前面子表达式1次或多次
?:匹配前面子表达式0次或1次
{n}:匹配确定的n次
{n,}:匹配至少n次
{n,m}:至少匹配n次最多匹配m次定位符
^ :匹配字符串开始位置
$:匹配字符串结尾位置
\b:匹配字边界
\B:匹配非字边界
\s:匹配空白字符
\uxxxx:匹配十六进制数xxxx规定的Unicode字符
i:大小写不敏感
[abc] [0-9]:匹配[]内字符
(a|b):匹配a或者b语法
* ^定位符限定符$
