ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

【文献阅读】Small Object Detection using Context and Attention

2020-12-29 12:29:20  阅读:295  来源: 互联网

标签:Attention 特征 检测 Object 目标 Context SSD 上下文 注意力


【基于上下文与注意力的小目标检测】Small Object Detection using Context and Attention

我的总结

  • 融合:fusion
  • 残差注意力模块:residual attention module
  • L2 Norm更适合融合操作
  • 基于SSD模型,Backbone是AGG16

本篇仅是简单阅读记录!!!


Small Object Detection using Context and Attention

文章连接:https://arxiv.org/abs/1912.06319v2

0 Abstract

为了提高小目标检测的精度,本文提出一种利用上下文的目标检测方法。
该方法通过连接多尺度特征,使用来自不同层的附加特征作为上下文。
还提出了具有注意力机制的目标检测,该机制可以聚焦于图片中的目标,并且可以包含来自目标层的上下文信息。


1 Introduction

目标检测的mAP较高了,但小目标mAP较低,SSD小目标检测mAP只能达到20.7%,还有很大的提升空间。
小目标检测难的原因是低分辨率有限的像素
把上下文信息作为额外的信息可以帮助小目标检测。

  • 第一,为了提供足够的关于小对象的信息,作者通过利用来自更高层的更抽象的特征作为对象的上下文,从小对象的周围像素中提取上下文信息。通过连接小对象的特征和上下文的特征,我们增加了小对象的信息,使得检测器可以更好地检测对象。
  • 第二,为了专注于小对象,作者在早期层使用了一种注意力机制。这也有助于减少背景中不必要的浅层特征信息。在作者的实验中,作者选择SSD作为基线。然而,这个想法可以推广到其他网络。

2 Related Works

深度学习目标检测:

  • R-CNNFast R-CNN,慢,两步
  • Faster R-CNN,速度提升,两步
  • SSD,YOLO,快,一步
  • 检测小目标都不太好

小目标检测:

  • 数据扩充,减小大目标尺寸,解决数据不足的问题
  • 反卷积技术放大特征图,DSSD反卷积所有特征图,模型复杂度变高,速度降低;R-SSD通过池化和反卷积混合不同尺寸的特征图,相较于DSSD速度精度皆有提升
  • 以低分辨率的特征作为GAN的输入,获得高分辨率的特征

视觉注意力网络:

  • 使用LSTM获取给定图片的相关部分,从而给图片创建图片字幕
  • 叠加残差注意力模块

3 Method

  • 第一,SSD通过特征融合来获取上下文信息,称为F-SSD。
  • 第二,SSD具有注意力模块,使网络能力集中在重要的部分,称为A-SSD。
  • 第三,作者结合了特征融合和注意力模块,命名为FA-SSD。

SSD:
其思想是利用早期特征图的较高分辨率来检测较小的物体,而利用分辨率较低的较深特征来检测较大的物体。
小目标检测精确度仍较差,原因:

  • 缺少上下文信息
  • 浅层特征层缺少语义信息
    在这里插入图片描述

F-SSD:
为了给作者想要检测对象的给定特征图(目标特征)提供上下文,作者将其与来自目标特征层的更高层的特征图(上下文特征)相融合。

  • 目标特征:【Conv4_3】–【3X3卷积,padding=1,stride=1,尺寸不变;BN;ReLU】–【融合:Stack堆叠融合】
  • 上下文特征1:【Conv7】–【反卷积deconvolution:将上下文特征转换为与目标特征尺寸一致】–【融合】
  • 上下文特征2:【Conv8_2】–【反卷积deconvolution】–融合
    在这里插入图片描述
    注:Batch Normalization 与 L2 Normalization
    详细解释见连接:https://blog.csdn.net/weixin_30344795/article/details/94804119

融合的方法如下图所示。
在这里插入图片描述


A-SSD
在这里插入图片描述
手绘残差注意力模块和图五(a)一样,手绘有助于理解,后续需阅读残差注意力模块论文

在这里插入图片描述


FA-SSD
在这里插入图片描述
注:本笔记仅为记录文献阅读,防止遗忘。如有侵权,立即删除!

标签:Attention,特征,检测,Object,目标,Context,SSD,上下文,注意力
来源: https://blog.csdn.net/qq_45552341/article/details/109433431

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有