• Home
  • About
    • Xmxxiong' Blog photo

      Xmxxiong' Blog

      记录、分享所学到的东西.

    • Learn More
    • Email
    • Github
    • Weibo
  • Notes
    • All Notes
    • All Tags
  • Projects

Fast RCNN

16 Apr 2018

Reading time ~1 minute

Fast RCNN 算法

  • 解决的问题:

    1. 避免了R-CNN中的冗余的特征提取操作,只对整张图像全区域进行一次特征提取;
    2. 用Rol pooling层取代最后一层max pooling层,同时在此处引入建议框信息,提取相应建议框特征;
    3. 网络末尾采用并行的不同的全连接层,可同时输出分类结果和回归结果,实现了end-to-end的多任务训练;
    4. 无需额外的磁盘空间缓存特征;
    5. 比R CNN和SPPNet有着更高的目标检测精度和更快的检测速度。

  • 流程:
  •     1. 任意size的图像输入CNN,经过卷积和池化得到特征图;
        2. 在任意size图片上采用selective search算法提取约2K个建议框;
        3. 根据图中建议框到特征图映射关系,在特征图中找到建议框对应特征框,并利用Rol池化层将每个特征框池化到H*W的大小;
        4. 将固定了大小的特征框经过全连接层得到固定大小的特征向量;
        5. 将第4步中的特征向量经过不同的全连接层,分别得到两个输出向量:一个softmax的分类得分,一个是Bounding-box窗口回归;
        6. 利用窗口得分分别对每一类物体进行非极大抑制提出重复建议框,最终得到每个类别中回归修正后的得分最高的窗口。

  • 存在的问题:  

    1. 每张图片由ss算法产生的约2000的建议框消耗了大量的计算资源和时间;
    2. 没有实现真正意义上的end-to-end的训练模式。
 

  • 参考: Fast R-CNN 简单梳理
    Fast R-CNN论文详解