This is an old revision of the document!
Fast RCNN
实现大部分end-to-end训练(提proposal阶段除外): 所有的特征都暂存在显存中,就不需要额外的磁盘空。
这个网络有两个输入,一个是整张图片,另一个是候选proposals算法产生的可能proposals(region proposal由selective search方法得到)的坐标。(言下之意是候选proposals算法与网络是分离的)
提出了一个RoI层,算是SPP的变种,SPP是pooling成多个固定尺度,RoI只pooling到单个固定的尺度 (论文通过实验得到的结论是多尺度学习能提高一点点mAP,不过计算量成倍的增加,故单尺度训练的效果更好。)