backbone能够接收整张输入图片并提取特征图。整张图片经过backbone得到共享特征图feature map。该feature maps被共享用于后续的RPN层和ROI Pooling
Region Proposal Networks。RPN网络用于生成region proposals。该层通过softmax判断anchors属于positive或者negative,再利用bounding box regression修正anchors获得精确的proposals。
ROIpooling层。该层收集输入的feature maps和proposals,综合这些信息后提取proposal feature maps,送入后续全连接层判定目标类别。
利用proposal feature maps计算proposal的类别,同时再次bounding box regression获得检测框最终的精确位置。
Faster Rcnn的模型结构如下: