MySQL 正则表达式详解

一. 介绍

正则表达式用来描述或者匹配符合规则的字符串. 它的用法和 like 比较相似, 但是它又比 like 更强大, 能够实现一些很特殊的规则匹配; 正则表达式需要使用 REGEXP 命令, 匹配上返回 "1" 匹配不上返回 "0", 默认不加条件 REGEXP 相当于 like '%%'. 在前面加上 NOT 相当于 NOT LIKE.

命令	说明
^	在字符的开启处进行匹配
$	在字符的末尾处进行匹配
.	匹配任何字符（包括回车和新行）
[….]	匹配括号内的任意单个字符
[m-n]	匹配 m 到 n 之间的任意单个字符，例如 [0-9],[a-z],[A-Z]
[^..]	不能匹配括号内的任意单个字符
a*	匹配 0 个或多个 a, 包括空, 可以作为占位符使用.
a+	匹配一个或多个 a, 不包括空
a?	匹配一个或 0 个 a
a1\| a2	匹配 a1 或 a2
a{m}	匹配 m 个 a
a{m,}	匹配 m 个或者更多个 a
a{m,n}	匹配 m 到 n 个 a
a{,n}	匹配 0 到 n 个 a
(….)	将模式元素组成单一元素，例如（do）* 意思是匹配 0 个多或多个 do

二使用测试

在字符串开始处进行匹配

MySQL> SELECT  'abc' REGEXP '^a';
+-------------------+
| 'abc' REGEXP '^a' |
+-------------------+
|                1 |
+-------------------+
row in set (0.00 sec)
$

在字符串末尾开始匹配

MySQL> SELECT  'abc' REGEXP 'a$';
+-------------------+
| 'abc' REGEXP 'a$' |
+-------------------+
|                0 |
+-------------------+
row in set (0.01 sec)
MySQL> SELECT  'abc' REGEXP 'c$';
+-------------------+
| 'abc' REGEXP 'c$' |
+-------------------+
|                1 |
+-------------------+
row in set (0.00 sec)
.

匹配任意字符

MySQL> SELECT  'abc' REGEXP '.a';
+-------------------+
| 'abc' REGEXP '.a' |
+-------------------+
|                0 |
+-------------------+
row in set (0.00 sec)
MySQL> SELECT  'abc' REGEXP '.b';
+-------------------+
| 'abc' REGEXP '.b' |
+-------------------+
|                1 |
+-------------------+
row in set (0.00 sec)
MySQL> SELECT  'abc' REGEXP '.c';
+-------------------+
| 'abc' REGEXP '.c' |
+-------------------+
|                1 |
+-------------------+
row in set (0.00 sec)
MySQL> SELECT  'abc' REGEXP 'a.';
+-------------------+
| 'abc' REGEXP 'a.' |
+-------------------+
|                1 |
+-------------------+
row in set (0.00 sec)
[...]

匹配括号内的任意单个字符

MySQL> SELECT  'abc' REGEXP '[xyz]';
+----------------------+
| 'abc' REGEXP '[xyz]' |
+----------------------+
|                    0 |
+----------------------+
row in set (0.00 sec)
MySQL> SELECT  'abc' REGEXP '[xaz]';
+----------------------+
| 'abc' REGEXP '[xaz]' |
+----------------------+
|                    1 |
+----------------------+
row in set (0.00 sec)
[^...]

注意 ^ 符合只有在 [] 内才是取反的意思, 在别的地方都是表示开始处匹配

注意: REGEXP 前的匹配字符作为一个整体

MySQL> SELECT  'a' REGEXP '[^abc]';
+---------------------+
| 'a' REGEXP '[^abc]' |
+---------------------+
|                  0 |
+---------------------+
row in set (0.00 sec)
MySQL> SELECT  'x' REGEXP '[^abc]';
+---------------------+
| 'x' REGEXP '[^abc]' |
+---------------------+
|                  1 |
+---------------------+
row in set (0.00 sec)
MySQL> SELECT  'abc' REGEXP '[^a]';
+---------------------+
| 'abc' REGEXP '[^a]' |
+---------------------+
|                  1 |
+---------------------+
row in set (0.00 sec)

注意: 'abc'作为一个整体, 所以它匹配不了 a

匹配 0 个或多个 a, 包括空字符串. 可以作为占位符使用. 有没有指定字符都可以匹配到数据

MySQL> SELECT 'stab' REGEXP '.ta*b';
+-----------------------+
| 'stab' REGEXP '.ta*b' |
+-----------------------+
|                    1 |
+-----------------------+
row in set (0.00 sec)
MySQL> SELECT 'stb' REGEXP '.ta*b';
+----------------------+
| 'stb' REGEXP '.ta*b' |
+----------------------+
|                    1 |
+----------------------+
MySQL> SELECT ''REGEXP'a*';
+----------------+
| ''REGEXP'a*' |
+----------------+
|              1 |
+----------------+
1 row in set (0.00 sec)
a+

匹配 1 个或者多个 a, 但是不包括空字符

MySQL> SELECT 'stab' REGEXP '.ta+b';
+-----------------------+
| 'stab' REGEXP '.ta+b' |
+-----------------------+
|                    1 |
+-----------------------+
row in set (0.00 sec)
MySQL> SELECT 'stb' REGEXP '.ta+b';
+----------------------+
| 'stb' REGEXP '.ta+b' |
+----------------------+
|                    0 |
+----------------------+
row in set (0.00 sec)
a?

匹配 0 个或者 1 个 a

MySQL> SELECT 'stb' REGEXP '.ta?b';
+----------------------+
| 'stb' REGEXP '.ta?b' |
+----------------------+
|                    1 |
+----------------------+
row in set (0.00 sec)
MySQL> SELECT 'stab' REGEXP '.ta?b';
+-----------------------+
| 'stab' REGEXP '.ta?b' |
+-----------------------+
|                    1 |
+-----------------------+
row in set (0.00 sec)
MySQL> SELECT 'staab' REGEXP '.ta?b';
+------------------------+
| 'staab' REGEXP '.ta?b' |
+------------------------+
|                      0 |
+------------------------+
row in set (0.00 sec)
a1|a2

匹配 a1 或者 a2,

MySQL> SELECT 'a' REGEXP 'a|b';
+------------------+
| 'a' REGEXP 'a|b' |
+------------------+
|                1 |
+------------------+
row in set (0.00 sec)
MySQL> SELECT 'b' REGEXP 'a|b';
+------------------+
| 'b' REGEXP 'a|b' |
+------------------+
|                1 |
+------------------+
row in set (0.00 sec)
MySQL> SELECT 'b' REGEXP '^(a|b)';
+---------------------+
| 'b' REGEXP '^(a|b)' |
+---------------------+
|                  1 |
+---------------------+
row in set (0.00 sec)
MySQL> SELECT 'a' REGEXP '^(a|b)';
+---------------------+
| 'a' REGEXP '^(a|b)' |
+---------------------+
|                  1 |
+---------------------+
row in set (0.00 sec)
MySQL> SELECT 'c' REGEXP '^(a|b)';
+---------------------+
| 'c' REGEXP '^(a|b)' |
+---------------------+
|                  0 |
+---------------------+
row in set (0.00 sec)

注意:^ 符合只有在 [] 内才是取反的意思, 在别的地方都是表示开始处匹配

a{m}

匹配 m 个 a

MySQL> SELECT 'auuuuc' REGEXP 'au{4}c';
+--------------------------+
| 'auuuuc' REGEXP 'au{4}c' |
+--------------------------+
|                        1 |
+--------------------------+
row in set (0.00 sec)
MySQL> SELECT 'auuuuc' REGEXP 'au{3}c';
+--------------------------+
| 'auuuuc' REGEXP 'au{3}c' |
+--------------------------+
|                        0 |
+--------------------------+
row in set (0.00 sec)
a{
	m,	
}

匹配 m 个或者更多个 a

MySQL> SELECT 'auuuuc' REGEXP 'au{3,}c';
+---------------------------+
| 'auuuuc' REGEXP 'au{3,}c' |
+---------------------------+
|                        1 |
+---------------------------+
row in set (0.00 sec)
MySQL> SELECT 'auuuuc' REGEXP 'au{4,}c';
+---------------------------+
| 'auuuuc' REGEXP 'au{4,}c' |
+---------------------------+
|                        1 |
+---------------------------+
row in set (0.00 sec)
MySQL> SELECT 'auuuuc' REGEXP 'au{5,}c';
+---------------------------+
| 'auuuuc' REGEXP 'au{5,}c' |
+---------------------------+
|                        0 |
+---------------------------+
row in set (0.00 sec)
a{
	m,n	
}

匹配 m 到 n 个 a, 包含 m 和 n

MySQL> SELECT 'auuuuc' REGEXP 'au{3,5}c';
+----------------------------+
| 'auuuuc' REGEXP 'au{3,5}c' |
+----------------------------+
|                          1 |
+----------------------------+
row in set (0.00 sec)
MySQL> SELECT 'auuuuc' REGEXP 'au{4,5}c';
+----------------------------+
| 'auuuuc' REGEXP 'au{4,5}c' |
+----------------------------+
|                          1 |
+----------------------------+
row in set (0.00 sec)
MySQL> SELECT 'auuuuc' REGEXP 'au{5,10}c';
+-----------------------------+
| 'auuuuc' REGEXP 'au{5,10}c' |
+-----------------------------+
|                          0 |
+-----------------------------+
row in set (0.00 sec)
(abc)

将 abc 作为一个序列匹配, 不用括号括起来都是用单个字符去匹配, 如果要把多个字符作为一个整体去匹配就需要用到括号, 所以括号适合上面的所有情况.

MySQL> SELECT 'xababy' REGEXP 'x(abab)y';
+----------------------------+
| 'xababy' REGEXP 'x(abab)y' |
+----------------------------+
|                          1 |
+----------------------------+
row in set (0.00 sec)
MySQL> SELECT 'xababy' REGEXP 'x(ab)*y';
+---------------------------+
| 'xababy' REGEXP 'x(ab)*y' |
+---------------------------+
|                        1 |
+---------------------------+
row in set (0.00 sec)
MySQL> SELECT 'xababy' REGEXP 'x(ab){1,2}y';
+-------------------------------+
| 'xababy' REGEXP 'x(ab){1,2}y' |
+-------------------------------+
|                            1 |
+-------------------------------+
row in set (0.00 sec)

总结

特别要注意最后的 () 的命令, 如果不使用 () 那么所有的都是指单个字符去做匹配, 如果需要使用多个字符作为一个整体去匹配, 就需要将多个字符使用 () 给括起来

1. 使用 REGEXP 和 NOT REGEXP 操作符(类似 LIKE 和 NOT LIKE);

2.REGEXP 默认也是不区分大小写, 可以使用 BINARY 关键词强制区分大小写; WHERE NAME REGEXP BINARY '^[A-Z]';

3.REGEXP 默认是部分匹配原则, 即有一个匹配上则返回真. 例如: SELECT 'Abc' REGEXP BINARY '[A-Z]';

来源: http://www.linuxidc.com/Linux/2019-05/158487.htm

与本文相关文章

暂无,快来抢沙发吧！