IoU-aware Single-stage Object Detector for Accurate Localization

佚名 4年前 (2020-02-24) 人工智能 568人围观抢沙发百度已收录

网络的结构如下：

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

采用FPN结构,Backbone是RetinalNet,分成了P3~P7共5个Layer,分别训练不同尺寸的Box.每个Layer对应的Head有2个分支,包括一个单独的分支用来预测分类,另一个分支用来预测两部分,一部分是Box坐标的回归,另一部分是GT Box和Anchor之间的IOU,这也是这篇论文的主要创新点,Faster RCNN等方法是对Anchor进行分类,与GT Box的IOU高于0.7的是正例,低于0.3的是负例,而这篇论文直接预测GT Box和Anchor之间的IOU.

Loss Function包括3个部分:分类损失,包括正例和负例,采用Focal Loss作为损失函数;回归损失,采用Smooth L1作为损失函数;IOU由于在0~1之间,采用Binary cross-entropy作为损失函数.