s*****e 发帖数: 115 | 1 群里牛人多,想上来请教个问题,可能只是个很初级的问题
最近用fasterRCNN train一个模型,需要把face和人的上半身找出来
现在是用了VOC2007的所有数据,加上28k张含有上班身和face的labeled数据(tightly
cropped)
结果train出来基本只能准确识别VOC2007的所有object, face和上半身基本看不到,
如果把threshold调低,那么false positive会太高
但是如果只用face和上半身的数据,对单个人检测就没有问题。对多人检测就是乱七八
糟。
这个一般是什么问题?现在需要一个model就要做到face和上半身,而且一定要一秒钟
最少能处理10张(1080TI好像勉强,感觉jetson就够呛了) |
l*******m 发帖数: 1096 | 2 这个不是什么新问题了。看看这篇
Is Faster R-CNN Doing Well for Pedestrian Detection?
还有RCNN 对feature extractor要求高,如果是用resnet-101,准确率十分高
tightly
【在 s*****e 的大作中提到】 : 群里牛人多,想上来请教个问题,可能只是个很初级的问题 : 最近用fasterRCNN train一个模型,需要把face和人的上半身找出来 : 现在是用了VOC2007的所有数据,加上28k张含有上班身和face的labeled数据(tightly : cropped) : 结果train出来基本只能准确识别VOC2007的所有object, face和上半身基本看不到, : 如果把threshold调低,那么false positive会太高 : 但是如果只用face和上半身的数据,对单个人检测就没有问题。对多人检测就是乱七八 : 糟。 : 这个一般是什么问题?现在需要一个model就要做到face和上半身,而且一定要一秒钟 : 最少能处理10张(1080TI好像勉强,感觉jetson就够呛了)
|
s*****e 发帖数: 115 | 3 谢谢!我先去看看这篇文章
还是不知道怎么样能把人的上半身train出来,或者不用CNN有别的办法?
用resnet101确实比VGG16要好,如果只用pedestrian含有上半身和头部的label,28k张
图片(每张只有一个人,tightly cropped,基本都有头部和上半身的label),train
出来,VGG16 train出来的training set都偶尔会有false positive,但是RESNET101就
基本全对
但是VGG16,在1080TI下面能做到一秒12-15张, RESNET就7-9张图片
把RPN和ROI pooling这两块出新feature map的地方放松参数增加
proposal会好点?
【在 l*******m 的大作中提到】 : 这个不是什么新问题了。看看这篇 : Is Faster R-CNN Doing Well for Pedestrian Detection? : 还有RCNN 对feature extractor要求高,如果是用resnet-101,准确率十分高 : : tightly
|
C*****5 发帖数: 8812 | 4 速度不行可以试试TensorRT加速
tightly
【在 s*****e 的大作中提到】 : 群里牛人多,想上来请教个问题,可能只是个很初级的问题 : 最近用fasterRCNN train一个模型,需要把face和人的上半身找出来 : 现在是用了VOC2007的所有数据,加上28k张含有上班身和face的labeled数据(tightly : cropped) : 结果train出来基本只能准确识别VOC2007的所有object, face和上半身基本看不到, : 如果把threshold调低,那么false positive会太高 : 但是如果只用face和上半身的数据,对单个人检测就没有问题。对多人检测就是乱七八 : 糟。 : 这个一般是什么问题?现在需要一个model就要做到face和上半身,而且一定要一秒钟 : 最少能处理10张(1080TI好像勉强,感觉jetson就够呛了)
|