·450 智能系统学报 第4卷 在P中随机抽取子集P。,Q中随机抽取子集 同的经验值(a=-1,R=0.98,E=10-7=0.6). QS。={P,Q}构成初始工作集;初始化权重 结果如图3所示,其中30000,20000和10000表示 @1,,当前检测率D· 在线训练集的样本数量.可以看出,通过增加在线训 3)动态级联学习: 练集的数据量,可以极大提高检测性能.通过Boot 循环t=1,…,T strap的方法,可以利用大的训练集提高检测率. a)对每个样本x:归一化权重0,以保证0,是 0.98i 0.94 一个概率分布,且∑仙=∑0 0.90 eP: 年086 b)使用D·=D·-V更新当前检测率,其中V 0.82 0.78 可由式(16)计算; 0.74 c)对每个特征训练弱分类器,找到最好的特征 0.70 0.66 630000人脸-20000非人脸 中(具有最大F)以及相应的弱分类器; 0.62 +-20000人脸-10000非人脸 d)将特征中,以及相应的弱分类器加入到Cas 0102030405060708090100 误检数 cade中; e)使用S。来调节特征中,的拒绝阈值0,; 图3在CMU-MUT正面人脸测试集中不同大小在线数 )更新动态工作集中所有样本的权重; 据集训练性能对比 Fig.3 Performance comparison of different online training g)f是动态工作集中的误检率,如果f<f,更 sets on the CMU-MIT frontal test sets 新动态工作集, 3.2 使用粒特征的效果 4)输出: 1.00 输出一个强的Boost分类器,以及它内部所有 0.96 0.92 弱分类器的一组拒绝阈值。 0.88 进0.841 3实验 0.80 0.76 为进行分类器训练,本实验从互联网等各种渠道 0.72 搜集了65000张图片,其中包括50000个人脸.通过随 0.68 +-Haa特征 0.64 6稀疏粒特征 机缩放和平移,产生了一个40万正样本和8000万负 0.606102030405060708090100 样本的训练集,以及一个100万的验证集然后将所有 误检数 样本归一为24×24像素的图片,如图2所示. 图4 在CMU-MUT正面人脸测试集中使用不同特征训 练的性能对比 Fig.4 Performance comparison of different types of features on the CMU-MIT frontal test sets 0.6 0.5 6Haar特征 0.4 ·稀疏粒特征 图2部分正负样本训练集 Fig.2 Part of training sets 0.2 选择CMU-MIT1数据集作为人脸检测的测试 0.1 集.CMU-MT包含了130张灰度图片,其中有511个 10 15202530 正面人脸.在实验中,检测率为检测出的人脸个数与 弱分类器数日 人脸总数的比值,误检数为所有检测出的检测框中非 图5使用不同特征训练过程中误检率的渐近线对比 人脸检测框的个数,即误检为人脸的个数]. Fig.5 Asymptotic testing false alarm rates using different 3.1使用大数据集进行训练的重要性 types of features 实验使用不同大小的在线训练集进行训练,除 与传统的Haar特征不同,本实验采用粒特征 了在线训练集大小不同外,其他训练参数都采用相 除了特征不同外,其他训练参数都采用相同的经验