一, 前言
最近经常碰到开发误删除误更新数据, 这不, 他们又给我找了个麻烦, 我们来看下整个过程.
二, 过程
由于开发需要在生产环节中修复数据, 需要执行 120 条 SQL 语句, 需要将数据进行更新
于是开发连上了生产数据库, 首先执行了第一条 SQL
- update tablename set source_name = "bj1062 - 北京市朝阳区常营北辰福第"
- where source_name = "- 北京市朝阳区常营北辰福第"
我们仔细看了下, 这个 SQL, 的确没有什么问题, where 条件也是正常的, 大意就是将这个地址的前面加字符串 bj1062, 是真的没有错误么? 是的没有错误. 开发执行完成后, 结果的确是符合预期.
然后开发执行了剩下的 SQL, 都是和上面的 SQL 一样, 将地址进行更新. 执行完成后, 开发懵逼了, 发现 source_name 都变成了 0, 开发赶紧给我打电话说:
Harvey, 我执行了 update,where 条件都是对的, set 的值也是对的, 但是 set 后的字段全部都变成了 0, 你赶紧帮我看看, 看看能不能恢复数据.
我赶紧登上服务器, 查看了这段时间的 binlog, 发现了大量的 update tablename set source_name=0 的语句, 利用 binlog2sql 进行了解析, 项目地址: binlog2sql
赶紧和开发确定了操作的时间点, 生成 flashback 的 SQL, 进行了数据恢复, 同时保留现场证据.
然后对开发执行的 SQL 进行了 check, 发现了几条很诡异的 SQL:
这几条 SQL 的引号位置跑到了 where 字段名字后面, 简化后的 SQL 变成了:
update tbl_name set str_col="xxx" = "yyy"
那么这个 SQL 在 MySQL 他是如何进行语义转化的呢?
可能是下面这样的么?
update tbl_name set (str_col="xxx" )= "yyy"
这样就语法错误了, 那么只会是下面这样的形式,
update tbl_name set str_col=("xxx" = "yyy")
而
select "xxx" = "yyy"
的值是 0, 所以
update tbl_name set str_col="xxx" = "yyy"
等价于
update tbl_name set str_col=0
所以就导致了 source_name 字段全部更新成了 0.
我们再研究下 select 形式这种语句会怎么样.
- MySQL [localhost] {
- msandbox
- } (test)> select id,str_col from tbl_name where str_col="xxx" = "yyy";
- +----+---------+
- | id | str_col |
- | 1 | aaa |
- +----+---------+
- | 2 | aaa |
- +----+---------+
- | 3 | aaa |
- | 4 | aaa |
我们发现, 这个 SQL 将 str_col='aaa'的记录也查找出来了, 为什么呢?
- MySQL [localhost] {msandbox} (test)> warnings
- Show warnings enabled.
- MySQL [localhost] {msandbox} (test)> explain extended select id,str_col from tbl_name where str_col="xxx" = "yyy"\G
- *************************** 1. row ***************************
- id: 1
- select_type: SIMPLE
- table: tbl_name
- type: index
- 1 row in set, 1 warning (0.00 sec)
- possible_keys: NULL
- key: idx_str
- ref: NULL
- key_len: 33
- rows: 4
- Extra: Using where; Using index
- filtered: 100.00
- Note (Code 1003): /* select#1 */ select `test`.`tbl_name`.`id` AS `id`,`test`.`tbl_name`.`str_col` AS `str_col` from `test`.`tbl_name` where ((`test`.`tbl_name`.`str_col` = 'xxx') = 'yyy')
这里他把 where 条件转化成了
((`test`.`tbl_name`.`str_col` = 'xxx') = 'yyy')
这个条件的首先判断 str_col 和'xxx'是否相等, 如果相等, 那么里面括号的值为 1, 如果不相等, 就是 0
然后 0 或者 1 再和和'yyy'进行判断,
由于等号一边是 int, 另外一边是字符串, 两边都转化为 float 进行比较, 可以看我之前的一篇文章
MySQL 中隐式转换导致的查询结果错误案例分析
'yyy'转化为浮点型为 0,0 和 0 比较恒等于 1
- MySQL [localhost] {
- msandbox
- } (test)> select 'yyy'+0.0;
- +-----------+
- | 'yyy'+0.0 |
- | 0 |
- +-----------+
- MySQL [localhost] {
- msandbox
- } (test)> select 0=0;
- +-----------+
- 1 row in set, 1 warning (0.00 sec)
- +-----+
- 1 row in set (0.00 sec)
- | 0=0 |
- +-----+
- +-----+
- | 1 |
这样导致结果恒成立, 也就是 select 语句等价于以下 SQL
select id,str_col from tbl_name where 1=1;
将查询出所有的记录.
三, 小结
在写 SQL 的过程中, 一定要小心引号的位置是否正确, 有时候引号位置错误, SQL 依然是正常的, 但是却会导致执行结果全部错误. 在执行前必须在测试环境执行测试, 结合 IDE 的语法高亮发现相应的问题.
来源: https://yq.aliyun.com/articles/672509