子查询
讲子查询之前, 我们先来看看视图, 何谓视图 ? 视图是基于 SQL 语句的结果集的可视化的表, 包含行和列, 就像一个真实的表, 但只是一张虚拟表, 我们可以将其视作为一张普通的表; 视图只供数据查询, 不能进行数据更改, 也不能保存数据, 查询数据来源于我们的实体表; 说的简单点, 视图就是复杂 SELECT 语句的一个代号, 为查询提供便利. 视图总是显示最近的数据, 每当我们查询视图时, 数据库引擎通过使用 SQL 语句来重建数据.
那何谓子查询, 它与视图又有何关系 ? 视图是持久化的 SELECT 语句, 而子查询就是将定义视图的 SELECT 语句直接用于 FROM 子句当中, 它是个一次性的视图, 在 SELECT 语句执行完之后就会消失. 光说概念, 可能还是不太好理解, 我们来看下视图与子查询的具体示例, 通过示例我们就能更好的理解了
假设我们有如下表
以及如下 3 个视图
那么我们可以用如下 SQL 来显示用户的三个额度
换成子查询的方式, SQL 如下
注意 SQL 的执行顺序, 子查询作为内层查询会首先执行; 原则上子查询必须设定名称, 所以我们尽量从处理内容的角度出发为子查询设定一个恰当的名称
普通子查询
上面讲到的子查询就是普通子查询, 非要给个定义的话, 就是返回多行结果的子查询. 这个在实际应用中还是用的非常多的, 这个相信大家都比较熟悉, 不做过多的说明, 只举个简单例子
假设我们有商品表: t_commodity
现在我们要实现如下要求: 统计出各个类别下商品的数量, 我们可以写出如下 SQL
标量子查询
普通子查询一般是返回多行结果 (偶尔也会只返回 1 行, 有时也会查不到结果); 当返回结果是 1 行 1 列时, 该子查询被称作标量子查询, 标量子查询有个特殊的限制, 必须而且只能返回 1 行 1 列的结果.
说的简单点: 标量子查询就是返回单一值的子查询. 由于返回值是单一值, 所以标量子查询可以用在 = 或 <> 这样需要单一值的比较运算符之中, 这也正是其优势所在. 我们来看一些简单的例子, 还是以 t_commodity 为例, 假设我们有如下需求, 我们该如何实现它
1, 查询出售单价高于平均出售单价的商品
2, 查询所有商品信息, 并在每个商品的信息中加入平均出售单价, 平均进货单价
3, 按照商品类别分类, 查询出平均出售单价高于全部商品的平均出售单价的商品类别 (类别名, 类别平均出售单价)
查询 1
第一感觉, 我们也许会写出如下的 SQL
实际上这个 SQL 执行会报错, WHERE 子句中不能使用聚合函数. 那这个查询要怎么写了, 此时标量子查询就派上用场了, SQL 如下
查询 2
这个 SQL 应该比较容易想到, SELECT 子句中加入 平均出售单价, 平均进货单价 列即可, 如下
查询 3
先以类别进行分组, 然后取分组后各个类别的平均出售价格, 与全部商品的平均出售价格比较, 过滤出满足条件的类别, SQL 如下
使用标量子查询时, 我们需要注意一点: 我们要明确的知道该子查询返回的结果就是单一值, 绝对不能返回多行结果. 不然执行会报错
关联子查询
关联子查询是指一个包含对表的引用的子查询, 该表也显示在外部查询中. 通俗一点来讲, 就是子查询引用到了主查询的数据数据. 在关联子查询中, 对于外部查询返回的每一行数据, 内部查询都要执行一次. 另外, 在关联子查询中是信息流是双向的, 外部查询的每行数据传递一个值给子查询, 然后子查询为每一行数据执行一次并返回它的记录. 然后, 外部查询根据返回的记录做出决策. 光看概念, 晦涩难懂, 我们结合具体的例子来看关联子查询
还是以商品表: t_commodity 为例, 如何选取出各商品类别中高于该类别平均出售价格的商品, 可能大家还没明白这个需求, 那么我们具体点
所有商品的类别, 出售价格如下
各类别及类别平均出售价格如下
我们得到的正确结果应该是
这个 SQL 我们要如何写? 像这样
是肯定不行的, 那正确的打开方式应该是怎么样的了, 此时需要关联子查询上场了, SQL 如下
子查询中的 WHERE 子句 (WHERE t1.category = t2.category) 至关重要, 它的作用是在同一商品类别中对各商品的出售单价与平均单价进行比较. 在对表中某一部分记录的集合进行比较时, 就可以使用关联子查询, 当出现 "限定" 或 "限制" 这样的词汇时, 通常会使用关联子查询.
在关联子查询中, 对于外部查询返回的每一行数据, 内部查询都要执行一次, DBMS 内部的执行结果类似如下
总结
1,SQL 执行顺序
2, 书写位置
子查询可以在 SELECT,INSERT,UPDATE 和 DELETE 语句中, 同 =,<,>,>=,<=,IN,BETWEEN 等运算符一起使用, 使用起来也是非常灵活的; 标量子查询出现的位置就更灵活了, 并不仅仅局限于 WHERE 子句中, 通常任何可以使用单一值的位置都可以使用, SELECE 子句, GROUP BY 子句, HAVING 子句, ORDER BY 子句, 也就是说, 能够使用常量或者列名的地方, 都可以使用标量子查询.
3, 效率问题
子查询的效率一直都是一个比较头疼的问题, 加合适的索引能改善效率, 但也只是局限于很少的情况; 如果数据量大, 对性能要求又高, 能不用子查询就尽量别用子查询, 尽量用其他的方式替代, 很多情况下, 子查询可以用关联查询来替代
来源: http://www.jianshu.com/p/2078b0300f3d