SSD 网络结构

SSD 算法, 其英文全名是 Single Shot MultiBox Detector.

SSD 的网络结构流程如下图所示:

SSD 总共 11 个 block, 相比较于之前的 VGG16, 改变了第 5 个 block 的第 4 层, 第 6,7,8 卷积层全部去掉, 分别增加了红框, 黑框, 黄框, 蓝框.

其 tensorflow 代码如下:

with tf.variable_scope(scope, 'ssd_300_vgg', [inputs], reuse=reuse):
        # Original VGG-16 blocks.
        net = slim.repeat(inputs, 2, slim.conv2d, 64, [3, 3], scope='conv1')
        end_points['block1'] = net
        net = slim.max_pool2d.NET, [2, 2], scope='pool1')
        # Block 2.
        net = slim.repeat.NET, 2, slim.conv2d, 128, [3, 3], scope='conv2')
        end_points['block2'] = net
        net = slim.max_pool2d.NET, [2, 2], scope='pool2')
        # Block 3.
        net = slim.repeat.NET, 3, slim.conv2d, 256, [3, 3], scope='conv3')
        end_points['block3'] = net
        net = slim.max_pool2d.NET, [2, 2], scope='pool3')
        # Block 4.
        net = slim.repeat.NET, 3, slim.conv2d, 512, [3, 3], scope='conv4')
        end_points['block4'] = net
        net = slim.max_pool2d.NET, [2, 2], scope='pool4')
        # Block 5.
        net = slim.repeat.NET, 3, slim.conv2d, 512, [3, 3], scope='conv5')
        end_points['block5'] = net
        #注意处
        net = slim.max_pool2d.NET, [3, 3], stride=1, scope='pool5')
        # Additional SSD blocks.
        # Block 6: let's dilate the hell out of it!
        #注意处
        net = slim.conv2d.NET, 1024, [3, 3], rate=6, scope='conv6')
        end_points['block6'] = net
        net = tf.layers.dropout.NET, rate=dropout_keep_prob, training=is_training)
        # Block 7: 1x1 conv. Because the fuck.
        #注意处
        net = slim.conv2d.NET, 1024, [1, 1], scope='conv7')
        end_points['block7'] = net
        net = tf.layers.dropout.NET, rate=dropout_keep_prob, training=is_training)
        # Block 8/9/10/11: 1x1 and 3x3 convolutions stride 2 (except lasts).
        end_point = 'block8'
        with tf.variable_scope(end_point):
            net = slim.conv2d.NET, 256, [1, 1], scope='conv1x1')
            #注意点: 实际上相当于下面的卷积操作进行 padding 了
            net = custom_layers.pad2d.NET, pad=(1, 1))
            net = slim.conv2d.NET, 512, [3, 3], stride=2, scope='conv3x3', padding='VALID')
        end_points[end_point] = net
        end_point = 'block9'
        with tf.variable_scope(end_point):
            net = slim.conv2d.NET, 128, [1, 1], scope='conv1x1')
            #注意点: 实际上相当于下面的卷积操作进行 padding 了
            net = custom_layers.pad2d.NET, pad=(1, 1))
            net = slim.conv2d.NET, 256, [3, 3], stride=2, scope='conv3x3', padding='VALID')
        end_points[end_point] = net
        end_point = 'block10'
        with tf.variable_scope(end_point):
            net = slim.conv2d.NET, 128, [1, 1], scope='conv1x1')
            net = slim.conv2d.NET, 256, [3, 3], scope='conv3x3', padding='VALID')
        end_points[end_point] = net
        end_point = 'block11'
        with tf.variable_scope(end_point):
            net = slim.conv2d.NET, 128, [1, 1], scope='conv1x1')
            net = slim.conv2d.NET, 256, [3, 3], scope='conv3x3', padding='VALID')
        end_points[end_point] = net

设计理念

参考博客:

目标检测算法之 SSD

彻底搞懂 SSD 网络结构

来源: http://www.bubuko.com/infodetail-3329076.html

与本文相关文章

暂无,快来抢沙发吧！