C++ 性能榨汁机之 switch 语句的背后

前言

几乎每本面向初学者的 C 语言或 C++ 书籍在前面两章都会提到分支控制语句 if......else 和 switch......case, 在某些情况下这两种分支控制语句可以互相替换, 但却很少有人去深究在 if......else 和 switch......case 语句的背后到底有什么异同? 应该选择哪一个语句才能使得效率最高? 要回答这些问题, 只能走到 switch 语句的背后, 看看这些语句到底是怎么实现的.

if 语句与 switch 语句

相信学过 C/C++ 的同学对这两个语句的异同早就了如指掌, if 语句作为条件判断, 满足条件进入 if 语句块, 不满足条件则进入 else 语句块, 而且 if 和 else 语句块又可以继续嵌套 if 语句. switch 则是通过判断一个整型表达式的值来决定进入到哪一个 case 语句中, 如果所有 case 条件都不满足则进入到 default 语句块.

// 简单的 if 语句
if (a == 1)
    i = 1;
else if (a == 2)
    i = 2;
else
    i = 3;
// 简单的 switch 语句
switch (a){
  case 1: i = 1;
  case 2: i = 2;
  default: i = 3;
}

编译器如何实现 switch 语句?

现在编译器已经足够智能和强大, 经过测试, g++ 实现 switch 语句的方式就至少有三种, 编译器会根据代码的实际情况, 权衡时间效率和空间效率, 去选择一个对当前代码而言综合效率最高的一种.

编译器实现 switch 语句的三种方式:

逐条件判断

跳转表

二分查找法

后面我们将就这三种实现方法适用的代码场景进行测试和分析.

1. 逐条件判断法

逐条件判断法其实就是和 if......else 语句的汇编实现相同, 编译器把 switch 语句中各个 case 条件逐个进行判断, 直到找到正确的 case 语句块. 这种方法适用于 switch 语句中 case 条件很少的情况, 即使逐个条件判断也不会导致大量时间和空间的浪费, 比如下面这段代码:

#include <algorithm>
int test_switch(){
    int i ;
    int a = std::rand();
    switch(a){
        case 0: i = 0;break;
        case 1: i = 1;break;
        case 2: i = 2;break;
        default: i = 3;break;
    }
    return i;
}

该代码对应的汇编代码如下:

movl	-4(%rbp), %eax
	cmpl	$1, %eax
	je	.L3
	cmpl	$2, %eax
	je	.L4
	testl	%eax, %eax
	jne	.L8
	movl	$0, -8(%rbp)
	jmp	.L6
.L3:
	movl	$1, -8(%rbp)
	jmp	.L6
.L4:
	movl	$2, -8(%rbp)
	jmp	.L6
.L8:
	movl	$3, -8(%rbp)
	nop

eax 寄存器存储的是判断条件值(对应于 C++ 代码中的 a 值), 首先判断 a 是否等于 1, 如果等于 1 则跳转到. L3 执行 a==1 对应的代码段, 然后判断 a 是否等于 2, 如果等于 2 则跳转到. L4 执行 a==2 对应的代码段...... 可能难理解的是第 6 行代码

testl %eax, %eax

, 其实这只是编译器提高判断一个寄存器是否为 0 效率的一个小技巧, 如果 eax 不等于 0 则跳转到. L8 代码段, 执行 default 代码段对应的代码, 如果 eax 等于 0 则执行 a==0 对应的代码段.

由上面对编译器生成汇编代码的分析, 我们可以发现: 编译器在这种情况下使用逐个条件判断来实现 switch 语句.

2. 跳转表实现法

在编译器采用这种 switch 语句实现方式的时候, 会在程序中生成一个跳转表, 跳转表存放各个 case 语句指令块的地址, 程序运行时, 首先判断 switch 条件的值, 然后把该条件值作为跳转表的偏移量去找到对应 case 语句的指令地址, 然后执行. 这种方法适用于 case 条件较多, 但是 case 的值比较连续的情况, 使用这种方法可以提高时间效率且不会显著降低空间效率, 比如下面这段代码编译器就会采用跳转表这种实现方式:

#include <algorithm>
int test_switch(){
    int i ;
    int a = std::rand();
    switch(a){
        case 0: i = 0;break;
        case 1: i = 1;break;
        case 2: i = 2;break;
        case 3: i = 3;break;
        case 4: i = 4;break;
        case 5: i = 5;break;
        case 6: i = 6;break;
        case 7: i = 7;break;
        case 8: i = 8;break;
        case 9: i = 9;break;
        default: i = 10;break;
    }
    return i;
}

该代码对应的汇编代码如下:

movl	-4(%rbp), %eax
	movq	.L4(,%rax,8), %rax
	jmp	*%rax
.L4:
	.quad	.L3
	.quad	.L5
	.quad	.L6
	.quad	.L7
	.quad	.L8
	.quad	.L9
	.quad	.L10
	.quad	.L11
	.quad	.L12
	.quad	.L13
	.text
.L3:
	movl	$0, -8(%rbp)
	jmp	.L14
.L5:
	movl	$1, -8(%rbp)
	jmp	.L14
# 后面省略......

在 x64 架构中, eax 寄存器是 rax 寄存器的低 32 位, 此处我们可以认为两者值相等, 代码第一行是把判断条件 (对应于 C++ 代码中的 a 值) 复制到 eax 寄存器中, 第二行代码是把. L4 段偏移 rax 寄存器值大小的地址赋值给 rax 寄存器, 第三行代码则是取出 rax 中存放的地址并且跳转到该地址处. 我们可以清楚的看到. L4 代码段就是编译器为 switch 语句生成的存放于. text 段的跳转表, 每种 case 均对应于跳转表中一个地址值, 我们通过判断条件的值即可计算出来其对应代码段地址存放的地址相对于. L4 的偏移, 从而实现高效的跳转.

3. 二分查找法

如果 case 值较多且分布极其离散的话, 如果采用逐条件判断的话, 时间效率会很低, 如果采用跳转表方法的话, 跳转表占用的空间就会很大, 前两种方法均会导致程序效率低. 在这种情况下, 编译器就会采用二分查找法实现 switch 语句, 程序编译时, 编译器先将所有 case 值排序后按照二分查找顺序写入汇编代码, 在程序执行时则采二分查找的方法在各个 case 值中查找条件值, 如果查找到则执行对应的 case 语句, 如果最终没有查找到则执行 default 语句. 对于如下 C++ 代码编译器就会采用这种二分查找法实现 switch 语句:

#include <algorithm>
int test_switch(){
    int i ;
    int a = std::rand();
    switch(a){
        case 4: i = 4;break;
        case 10: i = 10;break;
        case 50: i = 50;break;
        case 100: i = 100;break;
        case 200: i = 200;break;
        case 500: i = 500;break;
        default: i = 0;break;
    }
    return i;
}

改代码段对应的汇编代码为:

movl	-4(%rbp), %eax
	cmpl	$50, %eax
	je	.L3
	cmpl	$50, %eax
	jg	.L4
	cmpl	$4, %eax
	je	.L5
	cmpl	$10, %eax
	je	.L6
	jmp	.L2
.L4:
	cmpl	$200, %eax
	je	.L7
	cmpl	$500, %eax
	je	.L8
	cmpl	$100, %eax
	je	.L9
	jmp	.L2

代码第二行条件值首先与 50 比较, 为什么是 50 而不是放在最前面的 4? 这是因为二分查找首先查找的是处于中间的值, 所以这里先与 50 进行比较, 如果 eax 等于 50, 则执行 case 50 对应代码, 如果 eax 值大于 50 则跳转到. L4 代码段, 如果 eax 小于 50 则继续跟 4 比较...... 直至找到条件值或者查找完毕条件值不存在. 可以看出二分查找法在保持了较高的查询效率的同时又节省了空间占用.

总结

何时应该使用 if......else 语句, 何时应该使用 switch......case 语句?

通过上面的分析我们可以得出结论, 在可能条件比较少的时候使用 if......else 和 switch......case 所对应的汇编代码是相同的, 所以两者在性能上是没有区别的, 使用哪一种取决于个人习惯. 如果条件较多的话, 显而易见 switch......case 的效率更高, 无论是跳转表还是二分查找都比 if......else 的顺序查找效率更高, 所以在这种情况下尽量选用 switch 语句来实现分支语句. 当然如果我们知道哪种条件出现的概率最高, 我们可以将这个条件放在 if 判断的第一个, 使顺序查找提前结束, 这时使用 if......else 语句也可以达到较高的运行效率.

switch 语句也有他本身的局限性, 即 switch 语句的值只能为整型, 比如当我们需要对一个 double 型数据进行判断时, 便无法使用 switch 语句, 这时只能使用 if......else 语句来实现.

来源: https://juejin.im/entry/5afba267518825428630ab7c

与本文相关文章

暂无,快来抢沙发吧！