RCNN 算法
- 解决的问题:
1. 预先提取一系列较为可能是物体的候选区域;
2. 训练深度网络进行特征提取:先在(ILSVC 2012)识别库上进行预训练,而后用(PASCAL VOC 2007)检测库调优参数,最后在检测库上测评;
-
流程:
1. 通过select search从一张图片生成1K~2K个候选区; 2. 对于每个候选区,使用深度网络提取特征;
3. 特征送入每一类的SVM分类器,判断是否属于该类别;
4. 使用回归器精细修正候选框的位置。 -

-

-

-
存在的问题:
1. 单张图片处理速度较慢,因为每张图片由ss算法产生的约2000的建议框都需要进行变形后由CNN前向网络计算一次特征,重复区域存在计算冗余;
2. 训练过程十分复杂;
3. 针对传统CNN需要固定尺寸的输入图像,crop/warp产生物体截断或拉伸,会导致输入信息丢失;
4. 多个候选区域对应的图像需要预先提取,占用较大的磁盘空间。