MySQL 是一个开放源码的小型关联式数据库管理系统, 开发者为瑞典 MySQL AB 公司 MySQL 被广泛地应用在 Internet 上的中小型网站中由于其体积小速度快总体拥有成本低, 尤其是开放源码这一特点, 许多中小型网站为了降低网站总体拥有成本而选择了 MySQL 作为网站数据库
MySQL 是众多网站技术栈中的标准配置, 是广受欢迎的开源数据库, 已经推出了 8.0 的第一个候选发行版本接下来通过本文给大家分享 Mysql 8 新特性 window functions 的作用, 需要的朋友参考下吧
MySQL 8.0 的新特性包括:
对 Unicode 9.0 的开箱即用的完整支持
支持窗口函数和递归 SQL 语法, 这在以往是不可能或者很难才能编写这样的查询语句
对原生 JSON 数据和文档存储功能的增强支持
MySQL 8.0 的发布, 跳过了多个版本号 (从 5.5 开始), 由于 6.0 修改和 7.0 是用来保留做 MySQL 的集群版本, 因此采用了 8.0 的版本号
1. 问题
Mysql 8.0.2 中新增加了一个主要功能 - 窗口函数 window function
这个功能具体是解决什么问题? 下面先看一个 SQL 查询的场景, 看一下平时我们是怎么做的, 然后再看一下如何使用窗口函数来更方便的解决
(1) 准备测试表和数据
建一个简单的电影信息表, 字段有:
ID
release_year(发行年份)
category_id(所属分类 ID)
rating(评分)
- CREATE TABLE films (
- id int(11),
- release_year int(11),
- category_id int(11),
- rating decimal(3,2)
- )
插入测试数据
- insert into films2 values
- (1,2015,1,8.00),
- (2,2015,2,8.50),
- (3,2015,3,9.00),
- (4,2016,2,8.20),
- (5,2016,1,8.40),
- (6,2017,2,7.00);
整体形式如下
(2) 查询需求
查询每一年中的平均评分, 要求每条记录后面都显示当年的平均评分
例如 2015 年, 有 3 条记录, 8.00, 8.50, 9.00 的平均分是 8.5,2016 年有 2 条记录, 平均分是 8.3,2017 年有 1 条记录, 平均分为 7.00
最终结果的形式如下:
我们可以使用子查询来计算各年的平均分, 然后使用 join 把结果连接回去
- SELECT
- f.id, f.release_year,
- f.rating, years.year_avg
- FROM films f
- LEFT JOIN (
- SELECT f.release_year,
- AVG(rating) AS year_avg
- FROM films f
- GROUP BY f.release_year
- ) years
- ON f.release_year = years.release_year
是不是有点复杂, 下面看下窗口函数的处理方式
2. window functions 的解决方案
什么是 window functions
window functions 是对一组数据进行计算, 与使用 group by 时不同, 不会进行单行的结果输出, 而是与每条记录相关联
语法示例:
- SELECT
- function_name OVER ( window_definition )
- FROM (...)
window_definition 是定义要计算的记录集合, 就像是一个小窗口, 在整体数据集合上显示出一部分
function_name 指定了对于窗口中的数据集合执行什么计算
回头看下上面的那个查询, 需要计算每部电影所在年份的所有电影平均评分, 下面使用窗口函数来处理
- SELECT
- f.id, f.release_year,
- f.category_id, f.rating,
- AVG(rating) OVER
- (PARTITION BY release_year) AS year_avg
- FROM films f
window_definition 部分使用了 PARTITION BY 从句, 它告诉数据库把结果数据集合分割成更小的部分, 把 release_year 相同的放在一起, 函数 AVG(rating) 会对每个窗口数据进行计算, 然后把结果放到每一行中
查询示例 1
计算每部电影在所属年份中的评分排行位置
查询语句
- SELECT
- f.id, f.release_year,
- f.category_id, f.rating,
- RANK() OVER (PARTITION BY release_year
- ORDER BY rating DESC) AS year_rank
- FROM films f
window_definition 部分使用 PARTITION BY 来根据 release_year 划分窗口, 使用 ORDER BY 在窗口内排序
RANK() 函数可以返回一行数据在本窗口中的位置
查询结果
查询示例 2
查看每部电影在总排行榜中的位置
查询语句
- SELECT
- f.id, f.release_year,
- f.category_id, f.rating,
- RANK() OVER (ORDER BY rating DESC)
- AS general_rank
- FROM films f order by id
主语句中的 order by 保证了整个数据集的排序
window_definition 中没有使用 PARTITION BY, 那么就是把整个结果集合当做一个窗口, ORDER BY 对窗口中的数据根据 rating 做降序排序, 把得分最高的放前面
RANK() 函数取得每条记录在窗口中的位置
查询结果
3. 小结
窗口函数是 Mysql 8.0.2 中的高级特性, 可以方便的执行聚合计算, 而不用对结果集进行实际的聚合, 大大增加了灵活性可读性, 更便于维护
来源: http://www.phperz.com/article/18/0218/361387.html