当前位置：

首页
/
IT
/
程序
/
Python
/
sql server 编写简洁四则运算表达式脚本实现计算批次功能 (C# 等其它编程语言也能直接用此通用表达式)

sql server 编写简洁四则运算表达式脚本实现计算批次功能 (C# 等其它编程语言也能直接用此通用表达式)

问题:

在数据库编程开发中, 有时会遇到数据量比较大的情况, 如果直接大批量进行添加数据, 修改数据, 删除数据, 就会是比较大的事务, 事务日志也比较大, 耗时久的话会对正常操作造成一定的阻塞. 虽不至于达到删库跑路的程度, 但也严重影响了用户体验, 老是卡巴死机的感觉. 这时我们可以对这个大批量操作进行分小批事务操作处理, 使每批时间比较短, 减少阻塞. 大而化小, 小而化了. 举个例子: 如果大批事务需要跑 5 分钟, 那就阻塞了 5 分钟; 如果分成 10 个小批, 每小批 0.5 分钟, 那就降低了长时间阻塞的几率, 提高了用户体验.

把目光放宽广一点, 其实不只是在数据库编程, 有时候我们也需要在其他编程语言中, 实现分批处理的逻辑, 例如使用 C# 对大批量 Excel 数据进行处理.

对于如何求批次这个问题, 我们当然是希望有统一的计算公式, 不管是什么编程语言都通用的, 而不是换种编程语言, 就得根据不同编程语言的语法重新实现这个算法. 以达到快速开发目的, 一次写的表达式, 去到哪里都能通用.

而求批次这个问题有点像初中代数的求解:

已知总数据量 a, 每批数据量为 b, 求所需批次 x?

假设 a 为 388888,b 为 10000.

解决方案:

方法 1(不推荐):

如果是数据库编程, 可能大部分人的思维习惯就是:

先用 a / b 得出除得尽部分, 例如这里是 38;

然后再用 case when 去判断 a % b 除不尽部分也就是余数是否为 0, 如果不为 0, 则批次加 1, 例如这里是 8888, 虽然不够 10000, 但是也不在 38 个批次之内, 需要在第 39 批次.

使用 T-SQL 实现:@a / @b + case when @a % @b> 0 then 1 else 0 end

缺点:

很明显这样的表达式比较长, 不是很简洁.

而且如果改用 C# 实现, 可是不支持 case when 的, 得重新修改表达式实现功能.

方法 2(推荐):

可以直接根据四则运算, 表达式为 (@a + @b - 1) / @b

这个表达式, 是博主自己想到的方法, 解释如下:

由于序号是从 1 开始, 第 1 批是从 1 到 10000, 而不是从 0 到 9999, 所以这里 @a - 1, 就是为了从编程习惯的角度由序号 0 开始;

而 + @b 则是因为, 0 到 9999 中任意一个数字, 除以每批数据量 10000 的话, 都是 <1, 但实际是当 1 批了, 需要加回.

优点:

单纯使用四则运算, 无需 case when 等条件判断, 代码简洁.

方便代码移植到 C# 等其他语言, 只需要把参数改成相应 C# 变量之类, 无需把 case when 改成 C# 能支持的 if 之类条件判断.

方法 3(推荐):

可以直接根据四则运算, 表达式为 (@a - 1) / @b + 1

这个表达式, 也是博主自己想到的方法, 解释如下:

由于序号是从 1 开始, 第 1 批是从 1 到 10000, 而不是从 0 到 9999, 所以这里 @a - 1, 就是为了从编程习惯的角度由序号 0 开始;

而 + 1 则是因为, 0 到 9999 中任意一个数字, 除以每批数据量 10000 的话, 都是 < 1, 但实际是当 1 批了, 需要加回.

优点:

单纯使用四则运算, 无需 case when 等条件判断, 代码简洁.

方便代码移植到 C# 等其他语言, 只需要把参数改成相应 C# 变量之类, 无需把 case when 改成 C# 能支持的 if 之类条件判断.

方法 2 和方法 3, 从代数的角度看, 关系式是等价的:

方法 2 关系式去掉括号后是:@a / @b + 1 - 1 / @b

方法 3 关系式去掉括号后是:@a / @b - 1 / @b + 1

脚本:

/*
    问题: 已知总数据量 a, 每批数据量为 b, 求所需批次 x? 假设 a 为 388888,b 为 10000.
    脚本来源: https://www.cnblogs.com/zhang502219048/p/11108723.html
*/
declare @a int = 388888,
        @b int = 10000,
        @x1 int,
        @x2 int,
        @x3 int

-- 方法 1(不推荐): 除了四则运算外, 还有取模运算, 而 case when 条件判断更是使脚本变得长而复杂, 也不利于移植到其他编程语言

select @x1 = @a / @b + case when @a % @b> 0 then 1 else 0 end

-- 方法 2(推荐): 只使用四则运算就实现

select @x2 = (@a + @b - 1) / @b

-- 方法 3(推荐): 只使用四则运算就实现

select @x3 = (@a - 1) / @b + 1

-- 查看计算结果

select @x1 as x1, @x2 as x2, @x3 as x3

在博主的上一篇技术博文《sql server 使用公用表表达式 CTE 通过递归方式编写通用函数自动生成连续数字和日期》, 说明了怎么批量生成连续数字, 我们就直接生成 10W 数据量来验证一下本篇博文《sql server 编写简洁四则运算表达式脚本实现计算批次功能 (C# 等其它编程语言也能直接用此通用表达式)》所述的计算批次表达式是否正确.

问题扩展到:

已知总数据量 a, 每批数据量为 b, 求每条数据所属批次 x? 假设 a 为 100000,b 为 1000.

验证脚本:

/*
    问题: 已知总数据量 a, 每批数据量为 b, 求每条数据所属批次 x? 假设 a 为 100000,b 为 1000.
    作者: zhang502219048
    脚本来源: https://www.cnblogs.com/zhang502219048/p/11108723.html
    脚本基于: https://www.cnblogs.com/zhang502219048/p/11108991.html
*/
declare @a int = 100000,
        @b int = 1000
select vid

-- 方法 1(不推荐): 除了四则运算外, 还有取模运算, 而 case when 条件判断更是使脚本变得长而复杂, 也不利于移植到其他编程语言

, x1 = vid / @b + case when vid % @b> 0 then 1 else 0 end

-- 方法 2(推荐): 只使用四则运算就实现

, x2 = (vid + @b - 1) / @b

-- 方法 3(推荐): 只使用四则运算就实现

, x3 = (vid - 1) / @b + 1
into #t
from fun_ConcatStringsToTable(1,100000)

-- 查看所有数据和所属批次

select * from #t

-- 检查批次计算结果是否一致

select distinct case when x1 = x2 and x2 = x1 then 'Right!' else 'Wrong!' end as Result
from #t
drop table #t

验证脚本运行结果:

总结:

博主对于计算批次的新思路就介绍到这里, 大家如果觉得有用的话可以直接拿来用, 是不是觉得很方便呢? 感觉为批次计算的算法注入了新的思想, 标新立异.

来源: https://www.cnblogs.com/zhang502219048/p/11108723.html

与本文相关文章

暂无,快来抢沙发吧！