• Home
  • About
    • Xmxxiong' Blog photo

      Xmxxiong' Blog

      记录、分享所学到的东西.

    • Learn More
    • Email
    • Github
    • Weibo
  • Notes
    • All Notes
    • All Tags
  • Projects

RCNN

12 Apr 2018

Reading time ~1 minute

RCNN 算法

  • 解决的问题:

    1. 预先提取一系列较为可能是物体的候选区域;
    2. 训练深度网络进行特征提取:先在(ILSVC 2012)识别库上进行预训练,而后用(PASCAL VOC 2007)检测库调优参数,最后在检测库上测评;

  • 流程:
        1. 通过select search从一张图片生成1K~2K个候选区;       2. 对于每个候选区,使用深度网络提取特征;
        3. 特征送入每一类的SVM分类器,判断是否属于该类别;
        4. 使用回归器精细修正候选框的位置。

  • 存在的问题:  

    1. 单张图片处理速度较慢,因为每张图片由ss算法产生的约2000的建议框都需要进行变形后由CNN前向网络计算一次特征,重复区域存在计算冗余;  
    2. 训练过程十分复杂;
    3. 针对传统CNN需要固定尺寸的输入图像,crop/warp产生物体截断或拉伸,会导致输入信息丢失;
    4. 多个候选区域对应的图像需要预先提取,占用较大的磁盘空间。