RCNN

RCNN

  • Selective Search(相似合并)得到1k-2k个候选区域(慢,耗时)
  • 将框缩放到227*227,跑卷积(CNN, AlexNet),最后全连接输出特征
  • 将特征输入到SVM中分类
  • 将box输入到全连接进行修正位置
  • NMS

Fast RCNN

img

  • 将原图直接卷积得到特征图
  • ROI按照比例放到特征图上,进行ROI Pooling
  • SVM -> 全连接层

ROI Pooling: 将每个ROI 均匀分成M*N份,对每一份进行max pooling,从而将ROI大小统一成M*N,送到下一层

Faster RCNN

img

  • 特征提取部分的网络简称backbone,可替换成VGG16,ResNet等
  • RPN网络生成预测框,极大提高检验速度

RPN: 包括生成锚框(9种),二分类判断有无物体,位置再进行微调

FPN

img

as