作者|王海, 孙昊
头图|CFP.CN
背景
本月初, 一篇针对 "困在系统里" 的外卖骑手的新闻报道展现了外卖行业中险象环生的现状, 激起社会各界的广泛讨论. 面对外卖市场的激烈竞争, 平台持续地追求提升效率和降低成本, 采用大数据技术和人工智能算法, 并在发掘人力极限的过程中, 不断降低送餐时限, 使得全行业外卖订单单均配送时长在 2019 年比 3 年前减少了 10 分钟[51] , 显著提升了顾客体验, 推动外卖成为了劳动密集型和技术密集型模式结合的代表行业.
然而, 由于现有共享经济商业模式中服务提供者与平台并没有正式雇佣关系的特殊性, 平台对骑手的权益保障和社会福利的重视程度仍有待提高; 在现有的商业逻辑, 算法规则和考核制度面前, 为了完成更多订单以提高收入, 一些骑手违反交通法规甚至冒着生命危险 "乘风破浪". 据统计, 在 2017 年, 仅上海市就发生涉及快递和外卖行业的各类道路交通事故 117 起, 共造成 9 人死亡, 134 人受伤[50] .
当前, 激烈的市场竞争环境正推动外卖平台不断改进算法和骑手绩效考核方式. 社会在收获良好顾客体验, 较低配送成本和极高配送效率的同时, 也付出了骑手权益和行人安全降低的代价. 面对此外卖骑手困境, 我们将围绕其中的问题根源, 从平台设计运营和政府监督监管的视角, 系统性地提出一系列可以尝试的改进方案.
作为致力于大数据, 运筹学, 以及人工智能方法在智慧城市领域应用的学者和研究者, 我们期望用更加科学的运营流程和算法逻辑, 构筑健康, 温暖, 高效, 可持续并且具有社会责任的外卖生态体系.
我们的方案将从平台设计运营和政府监督监管两方面展开 --
在平台设计部分, 方案将聚焦骑手激励机制, 运营流程和算法, 以及供需调节机制等内容;
在政府监管部分, 方案将聚焦明晰劳资关系, 加强资质审核和运营监督, 明确平台责任, 以及市场竞争与政府干预等内容. 由于时间和篇幅所限, 本文并没有列举介绍所有可能的改进方向, 仅选择我们认为对解决外卖骑手困境最重要并且具有实际可行性的内容.
针对每项的具体内容, 我们在 "洞察" 部分介绍了相关的经济学和管理学原理, 或者相关的数据科学, 人工智能和优化算法的可能技术实现路线, 以供业内人士和专家学者等参考, 读者直接跳过该部分内容不会影响对全文的理解.
平台设计
1. 骑手激励机制设计
在围绕外卖骑手困境的讨论中, 改善骑手的激励和奖惩机制是大家关注的一个焦点.
在基于人工智能算法的外卖配送系统中, 从顾客成功下单的时刻起, 该系统便会自动化计算最优的订单分派和骑手配送路线, 并且预测订单的 "预计送达时间", 然后以此考核骑手的 "准点率"; 一旦订单配送超时, 骑手们将面临降低收入甚至淘汰出局的惩罚.
在此过程中, 值得重点关注的是, 这套 "最优" 方案只是在给定的历史数据和预设的模型参数下, 通过模拟现实得到的 "理想值" 或者 "乐观值". 因此, 面对复杂多变的现实场景, 外卖骑手的激励机制需要具备容错性和灵活性, 帮助外卖骑手抵抗已知或者未知的市场不确定性带来的负面冲击, 降低外卖骑手收入的波动, 这不仅有助于提升骑手们的福利水平, 也将会增强平台的总体运力.
(1)预计送达时间容错
面对无法避免的外卖订单配送超时风险, 平台可以考虑引入 "超时容错机制", 订单的 "预计送达时间" 设置和显示为一定的时间段 (例如,"17:20~17:25 到达"), 并且根据商家的备餐状态和骑手的配送情况动态调整, 提前向顾客提醒可能的超时送达, 而不是精确到具体的时刻(例如,"预计 17:23 到达") 甚至故意将顾客端显示的 "预计送达时间" 设定的短于骑手端.
洞察:
从技术层面而言, 即便是采用先进的深度学习算法, 模型学习到的结果也只是关于 "预计送达时间"(Estimated Time of Arrival, 简称 ETA)的统计分布, 并不能做到对每个样本的预测值都有绝对准确的 "信心"[47].
ETA 参数的区间估计结果 ("17:20~17:25") 会比点估计结果 ("17:23") 更加具有可信度, 因为后者并不能告诉顾客真实的送达时间与它的距离, 而前者则可以反映真实的送达时间所处的大致可信范围(confidence interval).
从管理层面而言, 区间形式的 "预计送达时间" 是应对预测算法的误差和外部配送环境的变化的容错策略, 体现的是对骑手和顾客负责任的态度. 与此相关, 平台还可以根据送达时间的区间设置弹性的实际送达时间考核标准: 如果实际送达时间在 "预计送达时间" 前后 N 分钟, 则该笔订单配送记录判定为 "正常", 如果实际送达时间超过 "预计送达时间"N 分钟, 则该笔订单配送记录判定为 "超时" 而纳入超时评估体系; 最后, 如果实际送达时间早于 "预计送达时间"N 分钟, 则该笔订单配送记录判定为 "快速" 而纳入高效奖励体系.
类似思想已经被外卖平台的 ETA 预估算法所采纳[47], 也可以作为超时容错策略体现在骑手激励机制设计中.
(2)弹性的超时奖惩
围绕超时容错机制, 平台可以考虑针对骑手 "超时率" 划分多个区间段, 设计更具有弹性的阶梯式超时奖惩规则: 超时率被划分成多个区间段, 例如,[0%, 5%],(5%, 10%] 以及 10% 以上, 如果骑手的超时率处于第一个区间段, 则骑手的绩效水平不会受到影响; 如果骑手的超时率处于第二个区间段, 则骑手的绩效水平将受到适当轻微的负面影响; 但是, 如果骑手的超时率处于更高的区间段, 则骑手的绩效水平将受到显著增强的负面影响.
洞察:
当前, 骑手们的超时率通常不得高于 3%, 否则, 包括骑手, 站长甚至区域经理等所有人都将面临绩效的惩罚 [51]. 那么, 从激励机制设计的本质而言, 无论是预计送达时间容错机制还是弹性超时奖惩机制, 从数学模型的角度, 都是在期望构建基于骑手工作绩效(即超时程度或者 "超时率") 的非线性激励机制.
类似分段阶梯式的非线性惩罚机制在线上多边平台市场中经常出现, 例如, 在网约车市场, 为了杜绝司机的刷单作弊行为, 平台会设计阶梯式作弊违规处罚标准:"第一次禁用 3 天, 第二次禁用 15 天, 第三次解除合作; 累计非法获利≥1000 元时, 解除合作永不录用"[39].
在激励骑手们准时配送以最大化日成交金额 (Gross Merchandise Volume, 简称 GMV) 或者日完单量的问题中, 订单的送达状态取决于配送过程中环境的不确定性, 骑手们的工作业务水平, 以及骑手们对承担风险的态度等多方面因素, 有一些因素只有骑手们自己知道, 而平台并不能完全掌握.
那么, 采用非线性激励机制是否一定会提升平台整体的运营效率呢? 从管理学理论上讲, 基于绩效的激励机制包含激励强度的 "斜率"(slope of incentive intensity)和激励的 "形状"(shape of incentivecontract)两个特征: 斜率是指激励强度关于绩效的变化率, 例如, 超时率增加一个单位将会带来的收入惩罚绝对变化值, 而形状是指激励关于绩效水平的非线性(或者称凹凸性).
研究表明, 高激励斜率有助于改善绩效水平, 而强非线性将会增强个体承担风险的偏好; 同时, 最新的实证结果显示, 激励的斜率会影响个体的风险偏好, 而激励的形状也会影响绩效水平[11].
因此, 构建基于骑手工作绩效的激励机制需要综合上述多方面因素, 合理选择激励关于绩效水平的斜率和形状, 这样有助于提升配送系统整体的效率.
(3)骑手配送超时互助保险
为了进一步应对外卖订单配送超时风险, 以及降低配送超时对骑手收入造成的激烈波动, 平台除了在用户端提供配送超时保险和赔偿之外, 还可以考虑尝试建立 "骑手配送超时互助保险" 机制: 该保险可由骑手自主选择是否加入, 即骑手在选择接单的同时还可以选择是否愿意为这笔订单缴纳较低金额的超时保险费, 这笔费用成为骑手之间互助的保险金额池. 如果骑手因为任何原因无法按时送达订单, 可由金额池向骑手提供经济补偿以降低其收入波动, 金额池内的余额最后都退还给骑手.
洞察:
在市场经济条件下, 保险是一个管理风险的常见工具, 例如, 在电子商务平台上, 保险公司会向第三方卖家推出以商品买家为被保险人的 "退换货运费险", 以便降低可能的退换货运费给买家造成的损失[42]. 在外卖行业中, 67% 的骑手家庭人口在 3 人~ 5 人, 四成骑手的爱人选择在家照顾孩子和老人, 同时, 五成骑手是家庭收入的主要来源, 七成骑手月收入在五千元以下, 这些数字意味着大多数骑手正面临着来自自身和家庭的双重消费压力[43].
那么, 设立 "骑手配送超时互助保险" 的核心目的在于希望能够建立大数量骑手们互助的保险金额池, 缓解超时对个体骑手带来的负面收入冲击, 降低个人收入的波动性, 最终发挥平滑骑手收入的作用.
研究表明, 在面对风险时, 低收入劳动者或者家庭通常会基于工作和消费等两类经济行为进行调节: 一是平滑收入(income smoothing), 例如, 通过同时兼任多份工作以提高收入来源的多样性和稳定性(在美团平台, 35% 的骑手拥有包括小生意或者其它外卖平台在内的其它收入来源[43]); 二是平滑消费(consumption smoothing), 例如, 调整自身的劳动力供给水平和使用保险协议[22].
从这两类经济行为可以看出,"骑手配送超时互助保险" 可以有助于骑手抵御超时风险, 降低收入的波动性, 也将会激励骑手提供更好的运力供给.
(4)考核周期延长
为了进一步帮助骑手降低收入的波动性, 平台可以考虑延长对骑手的考核周期, 将以较短 "时间段"(例如, 现在平台的冲单奖励活动和考核时间段一般是一天的某个时段), 或者以 "天" 为单位的奖励或者惩罚考核周期适当延长至 "星期" 甚至 "月", 通过实践寻找出最佳的考核周期, 以降低骑手对短期高频考核的焦虑, 提高系统的整体效率.
洞察:
类似基于时间段的冲单奖励看起来有助于满足高峰期时段的旺盛需求, 但是, 关于共享经济商业模式的实证研究表明, 理性的服务提供者为了尽可能获得活动期的高冲单奖励, 可能会选择在活动期开始之前策略性的停止工作, 以等待高峰期的到来, 这种 "前瞻"(forward-looking)行为将会导致平台在高峰期到来之前的运力供给出现下降, 给整个系统的运行效率造成负面影响[34].
考核周期的延长将有助于平滑骑手在不同时间段内的平均收入, 激励骑手们维持稳定的服务质量水平, 保障平台总体运力的平稳运行. 那么, 平台是否应该尽可能延长或者缩短激励机制中的考核周期呢? 最近, 一份关于产品销售人员薪酬体系设计的研究表明, 销售人员的工作绩效将会显著受到考核周期的影响: 当平台将激励机制的考核周期缩短时(比如, 从 "月" 度考核调整为 "天" 度考核), 原本优秀的销售人员就表现出了下降的绩效水平[10].
值得关注的是, 已有的行为学实验研究和现实商业现象表明, 基于考核目标的高频绩效评估会潜在地增加人员的焦虑心理和工作压力, 甚至会因为激发人员过于激进而引发欺诈和不道德行为[23][38].
基于上述结论, 并结合现实中 "外卖小哥在电梯里急哭了" 和逆行违章等现象, 我们可以总结到, 在外卖市场中, 虽然商品性质和商业逻辑并不一样, 但平台也需要综合骑手们的配送努力程度, 配送能力的差异性, 以及他们在进行运力供给决策中的前瞻行为等综合因素, 非常谨慎地制定出有助于降低骑手收入不确定性和提升平台整体服务能力的最佳的考核周期.
(5)多层次多属性绩效评估
除了上述直接根据 "超时率" 和 "完单量" 评估骑手绩效的指标, 平台应该建立基于综合服务质量, 配送效率和安全保障等多属性的多层次骑手绩效评估体系. 当前, 系统为骑手设置的积分等级体系是直接基于完单量, 准时率或者顾客评价奖励积分[51], 可以进一步提升骑手们的安全保障, 违章记录, 以及公益活动等有助于建设外卖生态体系的多个属性的重要性.
评估体系可以尝试根据政府部门监管法规和平台发展目标为不同评估指标设定优先级, 其中, 遵守交通安全法规应该成为外卖配送的基本要求.
洞察:
在多层次多属性绩效评估体系的设计过程中, 在第一层次, 考虑到遵守交通安全法规是外卖配送的基本要求, 那么, 骑手的 "违章率" 就需要摆在优先级最高的位置, 在一定的考核期内, 如果骑手的 "违章率" 超过了阈值, 则该骑手将被 "一票否决", 不会进入到下一层次的绩效评估; 在第二层, 维持并且提升市场占用率可能是当前平台运营的关键目标, 那么, 骑手们的 "完单量" 可以摆在优先级次高的位置, 在对 "完单量" 合理划分不同等级的奖励区间之后, 各骑手再根据实际 "完单量" 进入相应的评估区间; 最后, 在特定的基于 "完单量" 的评估区间内, 机制再综合服务质量和顾客评价等属性设定奖励金额.
另外, 平台可能需要同时实现 "违章率","日成交单量" 和 "超时率" 等多个关键绩效的管理目标, 对此多属性绩效目标导向的决策问题, 平台不仅需要考虑到实际绩效水平和管理目标的不确定性, 还需要关注多个绩效指标之间的相关性 (例如, 严格控制 "违章率" 会减少当前的 "日成交单量") 对绩效评估体系的影响[25].
(6)多向评分反馈
外卖市场主要是由顾客, 平台, 商家和骑手共同建立起来的生态圈, 当前系统采取的是顾客给商家或者骑手的单向评分方式, 忽视了骑手们的重要作用. 平台可以建立起 "多向" 评分反馈系统, 其中, 顾客给商家和骑手分别评分, 顾客对商家的菜品健康和口味等进行反馈, 对骑手的派送服务进行反馈; 骑手也可以自由选择给商家评分, 反馈商家出餐及时性等信息; 更进一步地, 骑手还可以给顾客评分, 反馈订单交付难度和顾客接单态度等信息.
与此同时, 平台根据商家, 顾客和骑手们的权力和义务, 并综合天气, 路况和其它不可控因素等, 设定公平合理的判责系统.
洞察:
在实际商业场景中, 例如, 网约车市场, 不仅乘客可以给司机评分, 司机也可以向乘客评分. 本质上而言, 建立多方评分反馈系统 (multi-lateral rating systems) 的核心目的是增强在线市场中各参与方之间的信任度[12], 降低各参与方之间的信息不对称性[17], 从而 "驱逐" 低质量的参与方, 并且降低交易成本.
为此, 平台需要认真思考两个重要问题: 一方面, 相比于传统的单向评分反馈系统, 多向评分反馈系统是否真的会提升市场效率和社会福利? 另一方面, 由于参与方做出准确的评分是基于自愿且需要付出成本的, 在平台没有提供适当奖励的情况下, 作为公共产品的用户评分将会供给不足[2]; 因此, 如果采取多向评分反馈系统, 平台应该如何激励尽可能多的参与方真实地披露信息并给出可信的评分结果?
关于第一个问题, 以共享经济商业模式为背景的理论研究表明, 相比于仅有顾客的单向评分, 顾客和服务提供者之间的双向评分将弱化服务提供者之间的竞争, 从而提高市场的均衡价格[17]; 另外, 在一定条件下, 双向的评分机制将会提升社会福利[26].
关于第二个问题, 平台需要合理设计向各参与方展示彼此评分结果的方式和时间: 如果平台在参与方完成评分之后立刻披露结果, 那么, 相关的被评价方可能在后续采取报复动作, 故意压低对方的评分, 从而导致顾客评分的 "失真"[6]; 但是, 如果平台在双方或者多方都完成评分或者允许评分的时间窗结束之后才披露结果, 那么, 这种策略将会显著降低评分者进行报复的可能性, 并且增加评分的真实性和供给量[13].
2. 运营流程和算法
以上从骑手激励机制方面介绍了外卖平台设计的改进方向, 本节将聚焦运营流程和算法设计等社会各界正在热烈讨论的话题. 算法本身是中性的, 而其蕴含的思想和流程则是由平台的商业逻辑和商业目标决定的, 在平台设计中, 平台可以进一步让运营流程和算法的目标或者逻辑更加兼顾顾客, 骑手和平台等多参与方的目标, 提升社会的整体福利水平.
为此, 根据通常的外卖配送流程, 我们分别提出针对顾客端, 骑手端和平台端的运营和算法改进方案, 包括餐馆推荐系统, 预计送达时间预测算法, 派单算法, 路径规划算法, 算法参数管理, 以及基础设施建设等六点建议.
(1)顾客端: 餐馆推荐系统
平台可以在实时餐馆推荐系统的设计中采用更多与应用场景相关, 反映实时供需情况和骑手空间分布的数据. 例如, 针对一个商家, 如果过去 1 个小时的骑手等待时间较短, 当前周边分布的骑手较多, 店内聚集的正在等待取餐的骑手较少, 或者正在准备的订单数量较少等, 在其它属性相近的条件下, 那么, 该商家在推荐排序算法的输出结果中可以被优先推荐.
推荐系统还可以根据实时已有订单的餐馆和骑手位置进行拼单推荐, 实现外卖的 "顺风车". 例如, 如果一位骑手正在顾客周边的商家等待取单, 而且预估取餐时间较长, 那么, 即使该商家不是距离顾客最近或者价格最低, 推荐系统也可以在一定程度上提高该商家的推荐权重和优先级.
洞察:
在当前实现的推荐系统中, 算法输入的应用场景数据至少由三大类组成[44]: 一是用户画像, 例如, 性别, 常驻地, 价格偏好, 食物偏好等; 二是食物画像, 包含商家, 外卖, 团单(即团购订单), 其中, 商家特征包含商家价格, 商家好评数, 商家地理位置等, 外卖特征包含平均价格, 配送时间和销量等, 团单特征包含适用人数和返购率等; 三是场景画像, 包含用户当前所在地, 时间, 定位附近商圈, 基于用户的上下文场景信息等.
如果基于上述方案改进餐馆推荐系统, 系统可以采用基于在线优化 (online optimization) 和增强学习 (reinforcement learning) 的算法, 实时更新客户端的餐馆推荐结果, 最终将餐馆推荐系统打造成调节市场供需平衡状态的重要工具之一. 另外, 关于实现外卖的 "顺风车", 类似思想已经在网约车市场中实现, 目的是希望通过将目的地相近或者顺路的订单整合在一起, 从而提升配送资源的利用率, 其中, 需要同时解决订单与骑手的双边匹配问题, 以及针对 "顺风车" 订单的配送费定价问题[19][17].
(2)顾客端: 预计送达时间预测算法
预计送达时间预测算法可以融合来自骑手的手机 GPS 实时定位数据, 手机运动传感器移动数据, 和安卓操作系统特定应用程序搜集的活动识别数据等多源异质数据集[28], 识别骑手在不同时刻所处的活动状态以及状态改变的时间点. 这将有助于提升订单交付时间的预测准确性, 尤其是和楼层高度, 小区内配送和顾客交付相关的时间. 同时, 为了明确商家和骑手的责任, 并且方便顾客对商家和骑手进行公平的评分, 平台应该分别预测, 显示和评估 "商家出餐时间" 和 "骑手送餐时间".
洞察:
在外卖配送场景中, 预计送达时间 (ETA) 是用户成功下单时刻到骑手将外卖送达到顾客手中的送达时间预测结果, 具体可以分解为压单时间(从商家接单到骑手接单), 到店时间(从骑手接单到骑手到店), 取餐时间(从骑手到店到骑手取餐), 送餐时间(从骑手取餐到到达用户), 以及交付时间(从到达用户到完成送达), 此过程还包含了出餐时间(从商家接单到商家出餐)[45].
关于骑手送餐时间, 一个最大的技术性挑战, 也是目前网友们激烈讨论的实际问题是对交付时间的预估, 即骑手到达用户附近下车后多久能送到用户手中: 一方面, 老旧小区没有电梯, 或者写字楼难以等到电梯等现实问题给骑手们快速交付订单带来困难; 另一方面, 在进行交付时间预估时, 算法的输入字段较少, 重要的维度特征仅包括交付地址(文本数据), 交付点的经纬度, 区域, 以及城市[48].
对此, 如果基于手机 GPS 实时定位数据, 手机运动传感器移动数据 (motion sensor data), 以及安卓操作系统 ActivityRecognitionClient API 搜集的活动识别数据(activity recognition data) 等改进 ETA 预测算法, 平台将更清晰地识别骑手运动状态, 例如, 电动车骑行中, 步行中, 奔跑中或者原地等待中等, 然后采用深度学习方法进行序列建模(sequence modeling), 实现对 ETA 尤其是交付时间的更准确地预测.
(3)骑手端: 派单算法
在派单过程中, 派单算法应当考虑骑手之间的订单负载均衡, 让不同骑手当前累积分配到的订单数量相对比较平均, 避免出现个别骑手承载过大的配送任务, 而有些骑手被闲置的局面. 同时, 派单算法还应当考虑骑手在当地区域的熟知程度和配送经验等有助于提升派单效率的多种因素.
洞察:
实时派单算法是智能配送系统中的重要组成部分, 当前的实时派单问题被描述为以离散马尔可夫决策过程 (Markov Decision Process) 为核心的动态随机优化问题, 其目标是一段时间内的顾客体验 (例如, 准时率) 和骑手效率 (例如, 单均行驶距离或者单均消耗时间) 等指标最优, 算法需要计算动态到达的订单分配给骑手的策略, 以及每个骑手后续的节点访问顺序(即路径规划, routing optimization)[49].
在对该问题进行合理建模和算法优化之后, 派单算法可以实现骑手订单负载均衡 (workload balance) 和融合骑手当地区域知识和配送经验. 对此, 建模人员可以通过在目标函数中引入 "最大化所有骑手的最小订单负载"(maxmin)或者 "最小化所有骑手的最大订单负载"(minmax)的方式进行调整.
另外, 派单算法引入骑手在当地区域的熟知程度和配送经验等因素, 这不仅意味着 ETA 的预测算法需要纳入骑手在当地区域的熟知程度和配送经验等重要指标, 也意味着派单算法需要考虑骑手们之间在这两个维度上的差异性. 综合以上因素, 由多目标优化算法 (multi-objective optimization) 给出满足多个目标的最佳派单结果[21].
(4)骑手端: 路径规划算法
与派单算法紧密关联的是路径规划算法, 算法应该引入与实际路况更为贴切的特征, 例如, 单行道, 限行, 机动车道和非机动车道, 以及交通管制和交通拥堵等, 并且根据实时信息进行调整.
洞察:
针对骑手路径规划的问题, 平台需要建立基于有向图的实时动态路径规划模型, 输入该模型的可行路径集合 (set of feasible routes) 需要根据离线信息进行缩小[33], 例如, 许多单行道, 限行路线和过街天桥不允许电动车经过的路线就应该作为强约束从集合中剔除; 另外, 该集合还需要根据实时信息进行调整, 例如, 出现严重交通拥堵或者临时交通管制的路线也应该被剔除.
同时, 面对随机的订单需求和配送时长, 该问题可以考虑借鉴离线 - 在线近似动态规划算法 [30](offline-online approximate dynamic programming) 或者在线再优化策略 [5] (online re-optimization strategy) 的思想进行求解.
(5)平台端: 算法参数管理
平台端对算法参数进行及时审核并且合理设置是解决外卖骑手困境的关键之一, 在此应该得到重点关注. 这个问题起源于平台在预测订单 "预计送达时间" 探索实践中的模型迭代过程: 在实际的 ETA 预估场景下, 算法的损失函数设计是以 "整体的预估结果能够尽量前倾" 为目的, 而且对于迟到部分会增加数值惩罚[47], 这意味着算法在不断 "逼迫" 骑手缩短实际送达时间, 而骑手每一次成功避免超时的历史记录都会让算法 "学习" 到可能更短的送达时间, 即便这个送达时间是骑手通过闯红灯, 逆行等违反交通规则甚至冒着生命危险的方式实现的. 基于此逻辑, 这些历史数据会进一步提高算法对骑手送达时间的 "期待", 从而使算法朝着缩短送达时间的方向进行要求和优化.
对此, 平台应该通过对实际送达时间等算法的参数进行及时审核和调整以终止上述的恶性循环, 也就是赋予算法 "底线思维". 遵守交通法规和维护行人安全是不可逾越的底线, 是数据预处理环节进行历史数据清洗和校正必须考量的因素, 是数学模型中的 "硬约束条件", 也是优化算法剔除不可行路径中必须满足的规则. 这也意味着订单送达时间应该存在着一个合理的, 无法通过算法不断优化而逾越的下界, 否则, 不管在任何激励机制和评分体系之下, 缺乏 "底线思维" 的算法流程会一直将骑手困在系统之中.
(6)平台端: 基础设施建设
针对最后 100 米配送问题, 平台可以尝试自建或者联合第三方物流公司建设外卖取餐柜[52]. 取餐柜的候选位置可以是办公场所, 写字楼, 医院以及高校, 而顾客可以选择线上下单, 线下取餐.
洞察:
考虑到取餐柜的选址将会影响顾客线上下单, 线下取餐 (buy-online-pick-up-in-facility) 的便利性, 平台可以进行两阶段的取餐柜网络设计优化: 在第一阶段, 平台可以结合各个区域的人口社会统计, 经济发展, 历史完单, 以及配送时长等多维度数据建立机器学习模型和计量经济学模型以预测各区域的潜在需求和建立取餐柜对需求的影响 [15]; 在第二阶段, 平台可以建立取餐柜设施选址(facility location optimization) 和骑手服务区划分 (service region allocation optimization) 的多阶段随机规划模型(multi-stage stochastic programming), 联合优化取餐柜的位置和骑手的派单服务策略.
除此之外, 在需求量较大的办公楼, 小区, 学校和医院等场所, 平台也可以考虑配备专职的终端派送人员, 一方面是因为终端配送人员对小区周边和电梯设备更加熟悉, 可以帮助降低因骑手对环境陌生而造成的顾客等待时间, 另一方面是能够实现对局部区域的订单统一管理和配送, 从而避免骑手的重复劳动.
洞察:
配备专职终端人员在提升平台整体运营效率的同时也会增加平台的运营成本, 需要进行深入的成本 - 效益分析. 分析框架可以将配送过程视为一个排队系统(queueing system)[32], 在指定场所配备专职的终端配送人员将会增加固定人力成本, 但是, 值得关注的是, 根据排队论, 配送骑手的每单的平均派送时间和顾客的等待时间等系统的服务质量指标之间存在着强烈非线形的关系, 这意味着通过配备专职终端人员以适当降低骑手们在这些场所所花的派送时间可能会带来系统服务质量指标的显著提高, 从而使得带来的配送效益可能会高于额外的人力成本.
在未来, 平台还可以推广使用机器人和无人机配送. 同时, 作为互联网公司, 平台可以通过在相关核心技术的资本投入和技术积累, 转型成为高科技公司. 实际上, 美团已经开始尝试无人车和无人机的配送: 在 2 月份疫情期间, 外卖平台利用无人配送车为北京市顺义区几个小区的居民做订单配送, 截至 9 月初, 平台已经累计使用无人车配送了超过 6000 多用户实际订单, 覆盖该站点超过 80% 的订单需求; 目前, 平台也在深圳等地进行无人机的运营测试[53].
洞察:
在设计无人车辅助的配送系统中, 面对无人车配送和骑手配送的两种模式, 考虑到无人车的在成本方面的优势和在灵活性方面的不足, 平台可以基于实际配送场景, 市场供需状态, 以及交通路况, 采用马尔可夫决策过程联合优化无人车和骑手之间的分配比例, 以及无人车和骑手的配送路线[29].
3. 供需调节机制
在实际的运营中, 外卖平台可以尝试对配送价格进行调整以调节市场供需. 平台可以根据配送距离和配送时段等诸多因素合理设计基础的派送价格和骑手端补贴; 另外, 平台也可以针对突变的供需情况, 实时调整骑手的配送费用来缓解供需不平衡的问题[46][36].
其实, 作为企业收益管理的重要工具, 动态定价已经在多个行业得到广泛使用, 包括在上个世纪 80 年代开始得到采纳的航空业, 90 年代开始得到采纳的酒店业和租车业[31], 以及当前新兴的共享出行行业[3].
在外卖行业, 平台面临的市场供需不协调的问题更加突出, 而且市场供需状态随时间变化剧烈. 采取不同形式的配送价格可以区分顾客对等待时间的实际需求和时间敏感性, 这对提高和使用供需弹性, 缓解供不应求带来的负面影响具有一定积极作用; 然而, 基于配送价格的动态定价机制并不能解决所有问题, 无论是在现实生活还是学术研究中仍然存在争议, 这依赖于平台对该策略的价值进行更加深入的探究.
(1)基于区域和时间段的时空动态定价
在调节市场供需平衡状态的过程中, 平台可以针对每笔订单的配送费实行基于配送区域, 下单时间或者送达时间的动态定价, 并且对愿意等待的顾客提供愿等打折.
洞察:
基于区域和时间段的时空动态定价 (dynamic & surging pricing) 通常可以分为 "乘积溢价"(multiplicative surge)和 "加和溢价"(additive surge)两类: 在特定区域和时间段内, 前者是指在基础价格上乘以一定倍数 (例如, 1.5 倍), 美国的网约车平台 Uber 早期就是使用该类溢价策略; 而后者是指在基础价格上加上与距离无关的常数(例如, 10 元), 这是 Uber 平台当前采用的最新溢价策略. 研究表明, 在供需动态变化的环境下, 相比于乘积溢价策略, 加和溢价策略是激励相容 (incentive-compatible) 的定价机制[14], 这为外卖平台设计基于配送费的实时动态定价策略提供了新的方向.
值得提醒的是, 实时动态定价策略在社会各界中仍然存在争议, 理论研究结果显示, 在共享出行市场的背景下, 理性的乘客和司机会策略性地等待更合适的价格或者收入, 如果市场状态比较平稳, 那么, 平台没有必要采用实时动态定价策略, 尤其是该策略可能造成乘客, 司机, 监管者之间对立的局面[9].
(2) 顾客灵活充值账户
为了弥补实时动态定价在区分顾客对等待时间的实际需求和时间敏感性方面的不足, 平台可以建立灵活的用户充值账户: 在高峰期时段, 如果需要外卖尽快送到, 顾客可以向个人在平台上的账户充入额外的金额, 这些资金并不会流入骑手或者平台, 而是作为用户的充值余额, 可以在低峰期时段点餐使用.
洞察:
顾客在高峰时段的充值行为将传递出其对派送的等待时间比较敏感的信号, 作为系统派单算法的依据, 并且, 顾客在低峰期使用账户余额订餐, 可以激发低峰时段的整体需求, 充分利用低峰期时段闲散的备餐和配送资源, 发挥平滑市场需求的作用. 针对网约车市场的研究结果表明, 在一定条件下, 合理设计用户充值账户机制 (integrated reward scheme with surge pricing) 可以实现多方共赢, 提升顾客, 司机和平台的整体社会福利[37].
(3)增加兼职和众包骑手
平台提升兼职和众包骑手的运力占比有助于提高运力调整的空间和弹性, 从而更有效的调节市场的供需平衡状态.
洞察:
平台的骑手分为专送全职骑手和众包兼职骑手, 前者的工作时间固定并且接受系统派单, 后者灵活决定工作时间并且可以有限次拒绝派单 [51]. 为了提升整体的运力供给, 尤其是满足高峰期时段的配送需求, 平台通常会采用现金奖励的方式补贴骑手. 实证研究表明, 在网约车市场中, 平台补贴将会从劳动者是否选择工作和工作时长两个维度影响劳动力供给, 而且, 兼职劳动者的收入供给弹性(supply elasticity) 更高[24].
这意味着外卖平台需要更加严密地研究骑手们的运力供给行为, 分析骑手们对期望收入水平发生变化而进行的运力供给调整, 然后合理设计平台上全职骑手和兼职骑手的比例, 并精准地向骑手, 尤其是兼职骑手提供补贴奖励.
4. 政府监管
精准的政府监管对外卖行业实现可持续健康发展至关重要. 深入而全面地理解平台的商业逻辑和运营流程有助于制定高效精准的监管措施, 这不仅依赖于平台向监管者真实而全面地披露公司运营相关的信息, 也依赖于监管部门联合第三方专业研究机构共同完成对信息的分析和总结[8]. 基于全面而系统的专业分析之后, 监管者再对平台和骑手的劳资关系, 运营过程中的资质审核和监管, 以及平台责任以法律法规形式进行统一规范.
(1)明晰劳资关系
相关部门需要加快出台法律法规, 明晰包括外卖骑手在内的自由职业者与共享经济 / 零工经济平台之间的劳资关系, 对全职骑手与兼职骑手的法律地位进行清晰的分类, 界定相应的权利和义务[16].
洞察:
针对相关的劳资关系, 国家发展改革委于 2020 年 7 月 14 日发布文件要求, 强化灵活就业劳动权益保障, 探索适应跨平台, 多雇主间灵活就业的权益保障, 社会保障等政策 [40]. 作为参考, 2019 年 9 月 18 日, 美国加州正式签署了 AB5 法案[7], 并于 2020 年 1 月 1 日正式生效. 该法案要求将临时合同工(例如, 网约车司机) 纳入雇主的正式受雇员工, 这意味着相关企业的业务成本 (例如, 最低工资, 保险和员工福利等) 将大幅增加, 并将影响公司的员工管理机制和定价机制.
实际上, 为了满足该法案的要求, 从 2020 年 7 月 9 日开始, Uber 平台已经开始允许司机自己根据服务时间和距离设定价格[27]. 目前, 围绕 AB5 法案, 以及自由职业者与平台之间的劳资关系仍然存在非常大的争议, 一部分学者建议创立一个新的, 介于雇员和合同工之间的第三类工作类别, 该类别将保留自由职业者的一部分工作灵活度, 同时, 赋予他们部分全职雇员可以享受到的福利待遇[16][35].
(2)加强资质审核和运营监督
交管, 人社, 应急管理等相关部门应当督促和加强对平台和骑手的资质审核和安全培训. 在劳动者申请加入平台过程中, 平台需要对骑手电动车的准入标准进行统一登记管理; 与此同时, 加强对平台运营流程的监督, 比如, 可以借助骑手 App 的渠道对平台的配送路径规划等算法进行监管审查, 严禁对骑手提供违反交通规则 (例如, 逆行) 的推荐路线; 相关部门还可以对平台上骑手每天的连续配送时长设置上限并进行合理监督, 避免出现因为骑手疲劳工作而造成的交通事故.
(3)明确平台责任
在对涉及快递和外卖行业的道路交通安全进行监管的过程中, 监管部门应该把平台所属骑手发生的交通事故和违章次数, 以及相应后果的严重程度作为对平台重要的监管指标, 按月度或者季度等进行考核和追责, 从而督促平台和骑手共同维护配送安全.
针对已经发生的交通事故, 已有的法院判决为相关的责任划分提供了具有现实意义的指导. 近日, 关于浙江省湖州市吴兴区的外卖骑手撞伤行人一案, 法院最后宣判, 外卖骑手虽然没有与平台签订法律劳务合同, 但对外是以 "平台网上订餐配送" 的名义为客户提供服务, 且在提供配送服务时受平台管理制度的约束, 报酬由平台发放, 因此, 无论是否与公司签合同, 在其接受配送任务后均与配送平台建立了雇佣关系, 在送餐中发生事故, 作为雇主的公司应承担赔偿责任[41]. 这一结果无疑明确了外卖平台必须加快运营管理流程的调整, 以保障骑手安全和行人安全.
(4)市场竞争与政府干预
监管部门需要在遵循平台竞争规律和市场调节作用的条件下制定提升社会福利的监管法规. 在市场经济环境下, 平台之间的自由竞争将会影响平台选择最优的骑手激励机制以及运营流程和算法. 但是, 竞争形成的市场结果并不一定能够实现社会各参与方的福利最大化, 可能陷入 "囚徒困境" 的局面.
例如, 如果一个平台没有严格遵守法规制度, 漠视骑手权益, 那么, 为了维持甚至扩大市场份额和利润, 其竞争对手很有可能也不会选择严格遵守法规制度和提升骑手权益. 为此, 监管部门应该充分考虑多平台竞争的市场环境, 以问题为导向制定相关法规, 一视同仁地对所有平台进行严格的监管.
洞察:
平台之间的市场竞争虽然会有助于提升市场效率, 但在一定的情况下, 也有可能出现市场失灵, 竞争无法达到最优的纳什均衡 (Nash equilibrium). 对此, 监管者可以考虑根据博弈论(game theory) 和机制设计 (mechanism design) 的理论和工具来刻画骑手, 顾客, 商家和多个平台之间的交互行为, 并研究市场中的平台竞争结果[1].
特别是针对竞争的外部性 (externalities) 可能导致出现的市场失灵的情况, 监管部门需要考虑相应的监管制度规则以引导相互竞争的平台向更有利于提升社会福利的方向发展.
总结
作为致力于大数据, 运筹学, 以及人工智能方法在智慧城市领域应用的学者和研究者, 我们从平台设计运营和政府监督监管两方面为解决外卖骑手困境提供了可能的解决方案, 探讨了骑手激励机制, 运营流程和算法, 供需调节机制等平台可以采取的运营策略, 并分析了明晰劳资关系, 加强资质审核和运营监督, 明确平台责任, 以及市场竞争与政府干预等监管者面临的挑战.
构筑健康, 温暖, 高效, 可持续并且具有社会责任的外卖生态体系, 需要我们从社会伦理, 法律制度以及经济学和管理学原理出发, 融合大数据技术和人工智能算法等工具, 充分满足不同目标下多参与方的核心利益.
最终, 让每一方都释放出最大的善意以实现共赢, 只有这样才能提升社会整体的福利水平, 让人们真正享受到科技为生活带来的便利.
作者简介:
王海: 清华大学学士, 麻省理工学院运筹学博士, 现为新加坡管理大学决策分析方向助理教授, 美国卡内基梅隆大学信息系统与公共政策学院访问教授; 研究方向为运筹学, 大数据, 优化算法, 以及人工智能的方法论及其在智慧城市场景的应用; 主要领域包括智能交通, 共享经济, 智慧物流, 以及智慧医疗等. 微信: pahaiwuya. 个人主页, http://wang-hai.net/
孙昊: 华中科技大学学士, 清华大学管理科学与工程博士, 现为香港大学经济及工商管理学院博士后; 研究方向为银行与金融中介, 在线市场设计, 统计学习方法与应用; 主要领域包括金融科技与创新, 共享经济等.
参考文献:
[1] Ahmadinejad, AmirMahdi, Hamid Nazerzadeh, Amin Saberi, Nolan Skochdopole, and Kane Sweeney. (2019). Competition in ride-hailing markets. Available at SSRN 3461119.
[2] Avery, Christopher, Paul Resnick, and Richard Zeckhauser. (1999). The market for evaluations. American Economic Review , 89(3),564-584.
[3] Bai, Jiaru, Kut C. So, Christopher S. Tang, Xiqun (Michael) Chen, and Hai Wang. (2019). Coordinating supply and demand on an on-demand service platform with impatient customers. Manufacturing & Service Operations Management , 21(3), 556-570.
[4] Basu, Amiya K., Rajiv Lal, V. Srinivasan, and Richard Staelin. (1985). Salesforce compensation plans: An agency theoretic perspective. Marketing Science , 4(4), 267-291.
[5] Bertsimas, Dimitris, Patrick Jaillet, and Sébastien Martin. (2019). Online vehicle routing: The edge of optimization in large-scale applications. Operations Research , 67(1), 143-162.
[6] Bolton, Gary, Ben Greiner, and Axel Ockenfels. (2013). Engineering trust: reciprocity in the production of reputation information. Management Science , 59(2), 265-285.
[7] California Legislative Information. Assembly Bill No. 5. September 18, 2019. https://leginfo.legislature.ca.gov/faces/billTextClient.xhtml?bill_id=201920200AB5.
[8] Calo, Ryan, and Alex Rosenblat. (2017). The taking economy: Uber, information, and power. Columbia Law Review , 117, 1623.
[9] Chen, Yiwei, and Ming Hu. (2020). Pricing and matching with forward-looking buyers and sellers. Manufacturing & Service Operations Management , 22(4), 717-734.
[10] Chung, Doug J., Das Narayandas, and Dongkyu Chang. (2020) The effects of quota frequency: Sales performance and product focus. Management Science .
[11] de Figueiredo Jr, Rui JP, Evan Rawley, and Orie Shelef. (2019). Bad bets: Nonlinear incentives, risk, and performance. Strategic Management Journal . https://doi.org/10.1002/smj.3111
[12] Einav, Liran, Chiara Farronato, and Jonathan Levin. (2016). Peer-to-peer markets. Annual Review of Economics , 8, 615-635.
[13] Fradkin, Andrey, Elena Grewal, and David Holtz. (2020). Reciprocity in two-sided reputation systems: Evidence from an experiment on Airbnb. Working Paper, MIT Sloan School of Management. https://andreyfradkin. com.
[14] Garg, Nikhil, and Hamid Nazerzadeh. (2019). Driver surge pricing. arXiv preprint arXiv:1905.07544.
[15] Glaeser, Chloe Kim, Marshall Fisher, and Xuanming Su. (2019). Optimal Retail Location: Empirical Methodology and Application to Practice: Finalist-2017 M&SOM Practice-Based Research Competition. Manufacturing & Service Operations Management , 21(1), 86-102.
[16] Hagiu, Andrei, and Julian Wright. (2019). The status of workers and platforms in the sharing economy. Journal of Economics &Management Strategy , 28(1), 97-108.
[17] Ke, Jintao, Hai Yang, Xinwei Li, Hai Wang, and Jieping Ye. (2020). Pricing and equilibrium in on-demand ride-pooling markets. Transportation Research Part B: Methodological 139: 411-431.
[18] Ke, T. Tony, Baojun Jiang, and Monic Sun. (2017). Peer-to-peer markets with bilateral ratings. In MIT Sloan Research Paper No. 5236-17; NET Institute Working Paper No (pp. 17-101).
[19] Li, Ruijie, Yu (Marco) Nie, and Xiaobo Liu. (2020) Pricing carpool rides based on schedule displacement. Transportation Science 54(4):1134-1152.
[20] Liu, Sheng, Long He, and Zuo-Jun Max Shen. (2018). On-time last mile delivery: Order assignment with travel time predictors. Management Science .
[21] Lyu, Guodong, Wang Chi Cheung, Chung-Piaw Teo, and Hai Wang. (2019). Multi-objective online ride-matching. Working paper, National University of Singapore. Available at SSRN 3356823.
[22] Morduch, Jonathan. (1995). Income smoothing and consumption smoothing. Journal of Economic Perspectives , 9(3), 103-114.
[23] Schweitzer, Maurice E., Lisa Ordóñez, and Bambi Douma. (2004). Goal setting as a motivator of unethical behavior. Academy of Management Journal , 47(3), 422-432.
[24] Sun, Hao, Hai Wang, and Zhixi Wan. (2019). Model and analysis of labor supply for ride-sharing platforms in the presence of sample self-selection and endogeneity. Transportation Research Part B: Methodological , 125, 76-93.
[25] Tsetlin, Ilia, and Robert L. Winkler. (2007). Decision making with multiattribute performance targets: The impact of changes in performance and target distributions. Operations Research , 55(2), 226-233.
[26] Tunc, Murat M., Huseyin Cavusoglu, and Srinivasan Raghunathan. (2019). Two-sided adverse selection and bilateral reviews in sharing economy. Available at SSRN 3499979.
[27] Uber Blog. California drivers: Set your own fares when you drive with Uber. June 25, 2020.
https://www.uber.com/blog/california/set-your-fares/.
[28] Uber Engineering. How trip inferences and machine learning optimize delivery times on Uber Eats. (2018). https://eng.uber.com/uber-eats-trip-optimization/.
[29] Ulmer, Marlin W., and Barrett W. Thomas. (2018). Same-day delivery with heterogeneous fleets of drones and vehicles. Networks ,72(4), 475-505.
[30] Ulmer, Marlin W. Justin C. Goodson, Dirk C. Mattfeld, and Marco Hennig. (2019). Offline-online approximate dynamic programming for dynamic vehicle routing with stochastic requests. Transportation Science , 53(1), 185-202.
[31] Wall Street Journal. (2015). Now prices can change from minute to minute. December 14, 2015.https://www.wsj.com/articles/now-prices-can-change-from-minute-to-minute-1450057990.
[32] Wang, Hai, and Amedeo Odoni. (2016). Approximating the performance of a "last mile" transportation system. Transportation Science , 50(2), 659-675.
[33] Wang, Hai. (2019). Routing and scheduling for a last-mile transportation system. Transportation Science , 53(1), 131-147.
[34] Wang, Hai, and Hao Sun. (2020). Peak-hour incentive design with strategic driver behavior. Singapore Management University, working paper.
[35] Wang, Hai, and Hao Sun. (2020). The optimal labor supply flexibility on ride-sharing platforms. Singapore Management University, working paper.
[36] Wang, Hai, and Hai Yang. (2019). Ridesourcing systems: A framework and review. Transportation Research Part B: Methodological , 129, 122-155.
[37] Yang, Hai, Chaoyi Shao, Hai Wang, and Jieping Ye. (2020). Integrated reward scheme and surge pricing in a ridesourcing market. Transportation Research Part B: Methodological , 134, 126-142.
[38] Zoltners Andris A, PK Sinha, and Sally E. Lorimer. (2016). Wells Fargo and the slippery slope of sales incentives. Harvard Business Review . (September), https://hbr.org/2016/09/wells-fargo-and-the-slippery-slope-of -sales-incentives.
[39] 滴滴出行. 滴滴专车司机作弊违规处罚标准. 2019 年 04 月 24 日. https://www.eycen.com/post/545.html.
[40] 发展改革委网站. 关于支持新业态新模式健康发展 激活消费市场带动扩大就业的意见. 2020 年 07 月 14 日. https://www.ndrc.gov.cn/xxgk/zcfb/tz/202007/t20200715_1233793_ext.html.
[41] 金融界. 浙江湖州外卖骑手撞伤行人, 法院判未签劳动合同的平台需担责. 2020 年 09 年 15 日.
https://baijiahao.baidu.com/s?id=1677901965178599201&wfr=spider&for=pc.
[42] 京东. 什么是退换货运费险? 2019 年 12 月 10 日. https://help.jd.com/user/issue/430-499.html
[43] 美团研究院. 新时代 新青年: 2018 年外卖骑手群体研究报告. 2019 年 1 月 17 日.
https://s3plus.meituan.net/v1/mss_531b5a3906864f438395a28a5baec011/official website/c21d0443-decf-41d5-9813-ef8eaa6516d0.
[44] 美团技术团队. 深度学习在美团推荐平台排序中的运用. 2017 年 07 月 28 日. https://tech.meituan.com/2017/07/28/dl.html.
[45] 美团技术团队. 即时配送的 ETA 问题之亿级样本特征构造实践. 2017 年 11 月 24 日.
https://tech.meituan.com/2017/11/24/gbdt.html.
[46] 美团技术团队. 美团外卖骑手背后的 AI 技术. 2018 年 03 月 29 日. https://tech.meituan.com/2018/03/29/herenqing-ai-con.html.
[47] 美团技术团队. 深度学习在美团配送 ETA 预估中的探索与实践. 2019 年 02 月 21 日.
https://tech.meituan.com/2019/02/21/meituan-delivery-eta-estimation-in-the-practice-of-deeplearning.html.
[48] 美团技术团队. 配送交付时间轻量级预估实践. 2019 年 10 月 10 日. https://tech.meituan.com/2019/10/10/distribution-time-prediction-practice.html.
[49] 美团技术团队. 美团智能配送系统的运筹优化实战. 2020 年 02 月 20 日. https://tech.meituan.com/2020/02/20/meituan-delivery-operations-research.html.
[50] 青年报. 快递, 外卖行业交通事故频发 去年 117 起事故致 9 死 134 伤. 2018 年 02 月 10 日.
http://app.why.com.cn/epaper/webpc/qnb/html/2018-02/10/content_51905.html.
[51] 人物. 外卖骑手, 困在系统里. 2020 年 9 月 8 日. https://mp.weixin.qq.com/s/Mes1RqIOdp48CMw4pXTwXw.
[52] 搜狐网. 高校为什么要布局智能外卖柜? 对学校有什么好处. 2019 年 6 月 21 日.
https://www.sohu.com/a/322101528_120167191.
[53] 中国日报中文网. 美团夏华夏: 不断深化现实物理场景应用 美团 AI 助力产业智能化转型. 2020 年 9 月 8 日. http://cn.chinadaily.com.cn/a/202009/08/WS5f56f6faa310084978423e53.html.
来源: https://www.huxiu.com/article/385298.html