RCNN系列对比图,来源
1、本文主要是记录RCNN。论文相对于以前的传统方法的改进有:
速度,经典的目标检测算法使用滑动窗口依次判断所有可能的区域。本文则(采用selective Search方法)预先提取一系列较可能是物体的候选区域,之后仅仅在这些候选区域上进行feature extraction,进行判断。 训练集,经典的目标检测算法在区域中提取人工设定的特征。本文则采用深度网络进行特征提取。使用两个数据库,一个较大的识别库(ImageNet ILSVC 2012):标定每张图片中物体的类别。一千万张图像,1000类。一个较小的检测库(PASCAL VOC2007):标定每张图片中,物体的类别和位置,一万图像,20类。本文使用是别人进行与训练得到CNN(有监督预训练),而后用检测库调优参数,最后在检测库上评测。 速度,经典的