(School of Information Science & Technology,Xiamen University Tan Kah kee College,Zhangzhou 363105,China)
face recognition; least square regression; local strengthen; adaptive; classification
DOI: 10.6043/j.issn.0438-0479.201809025
备注
为解决基于表示理论的分类法未考虑噪声样本对重构系数影响的不足,利用局部约束协同表示法改进最小二乘回归分类法,提出局部强化最小二乘回归分类法.该方法通过非负稀疏表示自适应选择近邻样本,并利用近邻样本的协同作用强化重构系数使得局部强化最小二乘回归分类法具有较好的鲁棒性和容噪性.该方法可以克服传统分类方法存在的过拟合问题.在4个人脸图像数据集上的实验结果表明该方法可以提高人脸识别准确率.
In order to improve the weakness of classification method based on the representation theorythat ignore the influence of noise on the reconstruction coefficients,we propose a local strengthen least-square regression classification method to improve the least-square regression classification method by using the local-constraint cooperative representation.The proposed method can select neighbor samples adaptively by using nonnegative sparse representation.It strengthens reconstruction coefficients by using neighbor data samples,and improves anti-noise ability.Furthermore,it can overcome the over-fitting problems that plague traditional classification methods.Experimental results on the four face recognition datasets show that this method can improve recognition accuracies.
引言
人脸识别是人工智能研究的重要分支,是一种应用广泛的模式识别技术[1-4],例如视频监控、考勤签到、刷脸支付和访问控制等.然而,在无约束环境下由设备拍摄的图像通常质量有限.各种人类面部表情、姿势和照明条件会影响面部图像的质量,导致出现标准化面部图像中的遮挡等问题; 此外高维度特征空间或欠采样数据集使得人脸识别任务更具挑战性.因此,尽管已经提出了一些识别方法[4-8],但仍然需要具有更高识别性能的鲁棒人脸识别方法.
传统的分类方法,如支持向量机(SVM),需要训练分类器,容易造成过拟合问题[9]; 而基于表示理论的分类方法[6,10-14]不需要训练分类器,可以避免过拟合问题,因此在图像识别、基因表达数据分类等方面得到了广泛的应用.稀疏表示(SR)分类法[6]是一种正则L1范数的基于表示理论的方法,其首先用SR方法表示训练样本并进一步重构测试样本,再利用L1范数的稀疏性质构建基于SR的分类器.类似地,还有一些基于表示理论的分类方法,比如非负最小二乘(NNLS)分类法[10]通过非负约束达到重构系数的稀疏性,进而构建具有稀疏功能的分类器; 最小二乘回归(LSR)分类法[11]通过正则L2范数达到重构系数的聚集性,进而构建具有聚集功能的分类器.然而,训练样本中可能存在大量的噪声样本,这些样本会影响重构系数的计算.SR、NNLS和LSR等方法在计算重构系数时,直接利用所有的训练样本进行计算并没有考虑噪声样本的影响.为此,简彩仁等[12]基于SR和LSR(SRLSR)分类法从剔除噪声样本的角度研究了基因表达数据的识别问题,其结果表明噪声样本会影响重构系数的计算,进而影响识别准确率.
考虑到远离测试样本的训练样本更有可能是噪声样本,因此加强测试样本附近的训练样本对重构系数的协同作用,可以提高重构系数抵抗噪声的能力.基于此,本研究提出局部强化LSR(local strengthen LSR,LSLSR)分类法.该方法利用非负稀疏表示自适应选择近邻样本,并通过近邻样本的协同作用强化重构系数,使得LSLSR分类法具有更好的鲁棒性和容噪性.因此,LSLSR分类法可以强化重构系数的表示能力,进而提高识别准确率.
1 相关工作
1.1 基于表示理论的重构系数求解方法假设y∈Rm×1是未知类别标签的人脸图像测试样本,X∈Rm×n是已知类别标签的人脸图像训练样本集,有n个样本和m个图像属性,其中mn.用已知类别标签的人脸图像训练样本集X重构未知类别标签的人脸图像测试样本y:
y≈∑ni=1xiωi=Xω,(1)
其中,xi为第i个训练样本,ω为重构系数.因为mn,式(1)是一个超定方程,求解ω的精确解没有意义.
为此,提出LSR模型
minω‖y-Xω‖22,(2)
不难得到ω的解析解
ω=(XTX)-1XTy.(3)
基于LSR模型,文献[11]中构建了LSR分类法.
对重构系数ω进行非负约束,可得到NNLS模型
minω‖y-Xω‖22,s.t. ω≥0,(4)
即为文献[10]中提出NNLS分类法的理论依据.
根据正则项的不同,改变正则范数可以得到如下的稀疏表示问题:
minω‖y-Xω‖22+λ‖ω‖1,(5)
其中,‖ω‖1是ω的L1范数,即ω非零元素绝对值之和.文献[15]中给出了一种快速计算上述稀疏表示模型的方法.文献[6]中利用该模型提出SR分类法.
1.2 最近邻子空间准则最近邻子空间准则[6]利用ω重构y,并对y进行分类.假设人脸图像数据集有d个类别{l1,l2,…,ld},对一个人脸图像测试样本y求解重构系数ω,对第p类计算如下的残差:
rp(y)=‖y-Xδp(ω)‖22,(6)
其中,δp(ω):Rn→Rn计算得到类ld的系数,其第j个元素定义为
(δp(ω))j={ωj, xj∈lp,
0, xjlp.(7)
最后,根据重构误差最小的原则对y进行归类,即测试样本y所属类别为
l=argmin1≤p≤drp(y).(8)
2 LSLSR分类法
针对SR、NNLS和LSR等方法在计算重构系数时没有考虑噪声样本影响的不足,借鉴最近邻子空间准则的思想,通过强化局部近邻样本对重构系数ω的影响,本研究提出LSLSR分类法.
2.1 目标函数借鉴基于表示理论的分类方法[6,10-14],利用岭回归[16]模型
minω‖y-Xω‖22+λ‖ω‖22,(9)
其中,λ>0是正则参数.直接用训练样本集X重构测试样本y,容易受到噪声样本的影响.
针对这一不足,为了强化局部近邻样本对LSR的影响,本研究提出LSLSR模型如下:
minω(1-γ)‖y-Xω‖22+γSL+λ‖ω‖22.(10)
其中:SL是局部强化项,代表局部近邻样本对LSR方法的影响; 0≤γ<1是平衡参数,用于平衡样本重构项和局部强化项.当γ=0时,式(10)退化为岭回归模型.本研究借鉴最近邻子空间准则,定义局部强化项为
SL=k-1∑bi∈N(y)‖bi-Xω‖22,(11)
其中,bi∈N(y)是样本y的近邻样本,k是近邻样本的个数,SL刻画了局部近邻样本对重构系数的影响.由此,得到如下的目标函数
minω(1-γ)‖y-Xω‖22+
γ1/k∑bi∈N(y)‖bi-Xω‖22+λ‖ω‖22,(12)
其中,式(12)的第一项是样本重构项,第二项是局部强化项,最后一项是岭回归惩罚项.
2.2 目标函数求解为了求解目标函数式(12),令目标函数为O(ω),不难得到
O(ω)=(1-γ)‖y-Xω‖22+γk-1·
∑bi∈N(y)‖bi-X ω‖22+λ‖ω‖22=
(1-γ)tr((y-Xω)T(y-Xω))+
γk-1∑bi∈N(y)tr((bi-Xω)T(bi-Xω))+
λtr(ωTω)=(1-γ)tr(yTy)+tr(ωTXTXω)-
2(1-γ)tr(ωTXTy)+
γk-1∑bi∈N(y)tr(biTbi)-
2γk-1∑bi∈N(y)tr(ωTXTbi)+λtr(ωTω),(13)
其中,tr(X)为矩阵X的迹,表示矩阵X主对角线元素的和,这里应用了tr(X)=tr(XT)和tr(XY)=tr(YX).对ω求导得
(O(ω))/(ω)=2XTXω-2(1-γ)XTy+2λω-
2γk-1∑bi∈N(y)XTbi,(14)
令(O(ω))/(ω)=0,得
ω=(XTX+λI)-1XT((1-γ)y+
γk-1∑bi∈N(y)bi).(15)
其中I为单位矩阵.
2.3 自适应近邻样本选择为了避免LSLSR分类法参数过多,采用自适应参数选择方法,通过下式求解非负稀疏表示问题的ω:
minω‖y-Xω‖22+λ‖ω‖1,s.t.ω≥0.(16)
由于ω值越大,说明其越重要,故取满足条件ω>mean(ω)的样本为近邻样本.
2.4 LSLSR分类法流程LSLSR分类法先通过对每个样本求解重构系数ω,再利用最近邻子空间准则对测试样本进行分类,如下为具体算法流程.
输入:X,y,γ,训练样本类别ltrain,正则参数λ.
输出:测试样本类别ltest.
1)标准化训练样本集X中的每个样本Xi和测试样本y,使Xi和y的模长度为单位长度,即L2范数为1;
2)利用式(16)选择近邻样本;
3)利用式(15)求解ω;
4)利用1.2节的最近邻子空间准则对测试样本y分类,得到测试样本类别ltest.
3 实验分析
3.1 实验数据与实验参数设置本研究通过对比基于SRLSR、SR、LSR、NNLS和K最近邻(KNN)分类法的分类准确率,实验验证了LSLSR分类法的有效性.
实验参数设置如下:SR和LSLSR分类法的正则参数λ设为0.01,LSLSR分类法的平衡参数γ设为0.5.实验采用交叉验证的方法对比各种分类方法的识别准确率,交叉验证的折数取值为4~10.
实验选用广泛应用在人脸识别研究中的4个人脸图像数据集:FERET(http:∥www.nist.gov/itl/iad/ig/colorferet.cfm)、PIE(http:∥www.datatang.com/data/11957)、ORL(http:∥www.datatang.com/data/13501)和Yale(http:∥cvc.yale.edu/projects/yalefaces/yalefaces.html)进行研究.各数据集的数据维数均为1 024,样本数分别为280,400,400,165,类别数分别为40,20,40,15.
3.2 实验结果与分析图1给出了在不同交叉验证折数下不同方法的识别准确率.表1给出了在不同交叉验证折数下不同方法的平均识别准确率.
由图1可知,LSLSR在FERET、PIE、Yale和ORL等数据集上的识别准确率均有明显的优势,LSLSR的识别准确率明显高于其他基于表示理论的分类方法(SR、NNLS、LSR、SRLSR).表1表明LSLSRC分类法的平均准确率也最高.这一结果表明
LSLSRC分类法通过强化近邻样本的协同作用可以提高抗噪能力,具有很好的鲁棒性,可以强化重构系数的表示能力,从而提高人脸识别准确率.
从图1和表1的结果不难发现,不是基于表示理论的KNN分类法的识别准确率最低,这反映了基于表示理论的分类方法可以有效地避免过拟合问题.
4 结 论
本研究提出LSLSR分类法,该方法通过加强近邻样本的作用达到减少噪声样本影响的目的.在4个常用的人脸图像数据集上的实验结果表明该方法可以明显地提高人脸识别准确率.本研究提出基于非负稀疏表示的自适应近邻样本选择方法可以避免近邻样本数量的选择.由于存在选择近邻样本的步骤,LSLSR分类法的运行时间开销比较大,如何更高效地剔除噪声样本将在以后的研究中给出.
- [1] TOLBA A S,EL-BAZ A H,EL-HARBY A A A.Face recognition:a literature review[J].International Journal of Signal Processing,2008,2(1):88-103.
- [2] 吴长虹,苏剑波,陈叶飞.抗年龄干扰的人脸识别[J].电子学报,2018,46(7):1593-1600.
- [3] 严严,陈日伟,王菡子.基于深度学习的人脸分析研究进展[J].厦门大学学报(自然科学版),2017,56(1):13-24.
- [4] GAO Y,MA J,YUILLE A L.Semi-supervised sparse representation based classification for face recognition with insufficient labeled samples[J].IEEE Transactions on Image Processing,2017,26(5):2545-2560.
- [5] 雷明仪,苏松志,李绍滋.卡口场景下人脸检测模型的自适应重训练算法[J].厦门大学学报(自然科学版),2017,56(3):429-436.
- [6] WRIGHT J,YANG A Y,GANESH A,et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2):210-227.
- [7] 任梓涵,杨双远.基于视觉跟踪的实时视频人脸识别[J].厦门大学学报(自然科学版),2018,57(3):438-444.
- [8] 付晓峰,张予,吴俊.遮挡表情变化下的联合辅助字典学习与低秩分解人脸识别[J].中国图象图形学报,2018,23(3):399-409.
- [9] 周志华.机器学习[M].北京:清华大学出版社,2016:121-139.
- [10] LI Y,NGOM A.Classification approach based on non-negative least squares[J].Neurocomputing,2013,118(11):41-57.
- [11] CHEN X,JIAN C.A tumor classification model using least square regression[C]∥International Conference on Natural Computation.Xiamen:ICNC,2014:753-758.
- [12] 简彩仁,陈晓云.基于稀疏表示和最小二乘回归的基因表达数据分类方法[J].福州大学学报(自然科学版),2015,43(6):738-741.
- [13] LIN G,YANG M,YANG J,et al.Robust,discriminative and comprehensive dictionary learning for face recognition[J].Pattern Recognition,2018,81(9):341-356.
- [14] GOU J,XU Y,ZHANG D,et al.Two-phase linear reconstruction measure-based classification for face recognition[J].Information Sciences,2018,4(433):17-36.
- [15] KIM S J,KOH K,LUSTIG M,et al.An interior-point method for large-scale l1-regularized least squares[J].IEEE Journal of Selected Topics in Signal Processing,2007,1(4):606-617.
- [16] HOERL A E,KENNARD R W.Ridge regression:biased estmation for nonorthogoral problems[J].Technometrics,1970,12(1):55-67.