如何使用 Soft-NMS 实现目标检测并提升准确率

非极大值抑制 (Non-Maximum suppression,NMS) 是物体检测流程中重要的组成部分.它首先基于物体检测分数产生检测框,分数高的检测框 M 被选中,其他与被选中检测框又明显重叠的检测框被抑制.该过程不断递归的应用于其余检测框.根据算法设计,如果一个物体处于预设的重叠阈值之内,可能会导致检测不到该待检测物体.因此,我们提出了 Soft-NMS 算法,该连续函数对非最大检测框的检测分数进行衰减而彻底移除.它仅需要对传统的 NMS 算法进行简单的改动而且不增加额外的参数.该 Soft-NMS 具有与传统 NMS 相同的算法复杂度,使用高校.Soft-NMS 也不需要额外的训练,并易于实现,它可以轻松的被集成到任何物体检测流程中.

NMS 算法介绍

物体检测是计算机视觉领域的一个经典问题,它为特定类别的物体产生检测边框并且对分类打分.传统的物体检测流程常常采用多尺度滑动窗口,根据每个物体类别的前景 / 背景分数对每个窗口计算其特征.然而,相邻窗口往往具有相关的分数,这会增加检测结果的假阳性,为了避免这样的问题,人们会采用非极大值抑制的方法对检测结果进行后续处理来得到最终的检测结果.目前为止,非极大值抑制算法仍然是流行的物体检测处理算法并能有效的降低检测结果的假阳性.

如下图所示,物体检测框图中,每一个检测框均会产生检测分数,那么对于图片中的一个物体可能对应多个检测分数.这种情况下,除了最正确 (检测分数最高) 的一个检测框,其余的检测框均产生假阳性结果.非最大值抑制算法针对特定物体类别分别设定重叠阈值来解决这个问题.

传统的非最大值抑制算法首先在被检测图片中产生一系列的检测框 B 以及对应的分数 S.当选中最大分数的检测框 M,它被从集合 B 中移出并放入最终检测结果集合 D.与此同时,集合 B 中任何与检测框 M 的重叠部分大于重叠阈值 Nt 的检测框也没随之移除.非极大值抑制算法中的最大问题就是它将相邻检测框的分数均强制归零.在这种情况下,如果一个真实的物体在重叠区域出现,则将会导致对该物体的检测失败并降低类算法的平均检测率 (mAP)

换一种思路,如果我们只是通过一个基于与 M 重叠程度相关的函数来降低相邻检测框的分数而非彻底剔除.虽然分数被降低,单相邻的检测框仍然在物体检测的序列中.下图的实例可以说明这个问题.

Soft-NMS 可提升目标检测的平均准确率

针对 NMS 存在的这个问题,我们提出了一种新的 Soft-NMS 算法,它秩序改动一行代码即可有效的改进传统贪心 NMS 算法.在该算法中,我们基于重叠部分的大小为相邻检测框设置一个衰减函数而非彻底将其分数置为 0.简单来讲,如果一个检测框与 M 有大部分重叠,它会有很低的分数,而如果检测框与 M 只有小部分重叠,那么它的原有检测分数不会受太大影响.在标准数据集 Pascal VOC 和 MS-COCO 等标准数据集上,Soft-NMS 对现有的物体检测算法在多个重叠物体检测的平均准确率有明显显著的提升.同时 Soft-NMS 不需要额外的训练且易于实习那,因此,它很容易被集成到目前的检测流程中.

Soft-NMS 伪代码,仅需要将 NMS 代码 (红色框) 替换为 Soft-NMS 代码 (绿色框) 一步即可完成

传统的 NMS 处理方法可以通过以下的分数重置函数 (Rescoring Function) 来表达:

在这个公式中,NMS 采用类硬阈值来判断相邻检测框是否保留.但是换一种方法,假设我们对一个与 M 高度重叠的检测框 bi 的检测分数进行衰减,而非全部抑制.如果检测框 bi 中包含不同于 M 中的物体,那么在检测阈值比较低的情况下,该物体并不会错过检测,但是,如果 bi 中并包含任何物体,即使在衰减过后,bi 的分数仍然较高,它还是会产生一个假阳性的结果.因此,在使用 NMS 做物体检测处理的时候,需要注意一下几点:

相邻检测框的检测分数应该被降低,从而减少假阳性结果,但是衰减后的分数仍然应该比明显的假阳性结果要高.

来源: http://www.bubuko.com/infodetail-2461197.html

与本文相关文章

暂无,快来抢沙发吧！