User Tools

Site Tools


cascade_r-cnn

CasCade Rcnn

模型介绍

  • 在目标检测中,需要一个IOU阈值来定义正负样本, 用于训练分类以及对正样本进行坐标回归。选取正负样本的方式主要利用候选框与ground truth的IOU占比,常用的比例是50%,即IOU>0.5的作为正样本,IOU<0.5作为负样本等。
  • 用低阈值训练的目标检测器通常产生噪声检测。但是,随着IOU阈值的增加,检测性能趋于下降。因此,很难抉择一个合适的IOU,无论高低都是有很大弊端的。
  • Cascade R-CNN提出了一种级联检测器,即通过级联的R-CNN网络,每个级联的R-CNN设置不同的IOU阈值,这样每个网络输出的准确度提升一点,用作下一个更高精度的网络的输入,逐步将网络输出的准确度进一步提高。
  • 总结:Cascade R-CNN就是使用不同的IOU阈值,训练了多个级联的检测器,使得网络输出精度进一步得到了提高。
  • Cascade R-CNN的模型结构如下:

cascade参数调节

  • 用不同的IOU阈值训练得到的检测模型对不同IOU的输入proposal的效果差别较大,因此希望训练每个检测模型用的IOU阈值要尽可能和输入proposal的IOU接近。
  • 图中,三条彩色曲线基本上都在灰色曲线以上,这说明对于这三个阈值而言,输出IOU基本上都大于输入IOU。
  • 那么就可以以上一个stage的输出作为下一个stage的输入,这样就能得到越来越高的IOU。总之,很难让一个在指定IOU阈值界定的训练集上训练得到的检测模型对IOU跨度较大的proposal输入都达到最佳,因此采取cascade的方式能够让每一个stage的detector都专注于检测IOU在某一范围内的proposal,因为输出IOU普遍大于输入IOU,因此检测效果会越来越好。

实现

论文

讲解

cascade_r-cnn.txt · Last modified: 2023/03/08 16:09 by xujianglong