• 唯一百姓论文网官方网站(其他网站均属假冒)。工作时间9:00-17:00,周末休息,QQ:1647439496。电话联系:15389037508(同微信)
当前位置:首页 > 论文列表 > 不同数据降维方法对人脸识别精度的影响分析

不同数据降维方法对人脸识别精度的影响分析


不同数据降维方法对人脸识别精度的影响分析
谭景尹

摘要:人脸识别一直是计算机视觉领域的热门研究课题,其旨在学习人的独特的脸部特征信息进行身份识别。人脸识别一般使用摄像机采集含有人脸的图像或视频,并自动在图像中检测和跟踪人脸,进而对人脸进行识别。得益于模式识别技术的迅速发展,人脸识别的精度和速度均取得突破。本文中,为了探讨现有人脸识别方法的应用边界,选择主成分分析(PCA)和线性判别分析(LDA)对同一人脸数据集进行降维,然后使用基于向量机进行分类,比较PCA和LDA在不同维数、使用不同的核函数进行分类时的准确率,从而选出最高准确度下所使用的算法以及参数组合。
关键字:人脸识别;主成分分析;线性判别分析;基于向量机;数据降维
1  引言
人脸识别技术是计算机视觉与模式识别领域的课题之一,基于人的脸部特征而开展相关的活动。根据人的面部特征所蕴含的信息来进行身份识别活动,从本质上说这是一种生物识别技术,主要是进行信息的采集以及信息的分析[1]。人脸识别涉及了模式识别、计算机视觉、心理学、生理学以及认知科学等方面的知识,在计算机的辅助下实现身份识别,是基于人的脸部的独有的特征进行身份验证的较为有效的手段。近年来,人脸识别技术已被广泛应用于各身份认证的场合中,例如银行交易身份认证、各种的门禁系统等,是辅助识别个人身份的有效手段。

早期的人脸识别针对的是二维图像,随着研究的深入,研究人员发现二位人脸识别容易受到外界因素的影响。为提高识别的准确性,研究人员投入到三维人脸识别的研究中[2],使得三维人脸识别技术得到发展。得益于图像采集设备的普及和实际使用的便捷性,目前人脸识别的主要对象仍然是普通RGB人脸图像。根据算法框架和设计思想的不同,已有的人脸识别方法主要包括特征脸方法和基于人工神经网络的识别方法两类。特征脸方法将人脸识别问题视为一个二维的识别问题, 是通过正交变换来实现的[3]。特征脸方法的思想是将图像由高维向量转换为低维向量,并形成低维线性向量空间,通过人脸像素点投影到这一个地位空间所得到的投影系数作为识别的特征矢量,产生了一个由“特征脸”矢量张成的人脸子空间。而神经网络则是由众多的神经元可调的连接权值连接而成,具有大规模并行处理、分布式信息存储、良好的自组织自学习能力等特点。
在如今这个科技发达的时代,人们开始热衷于使用人脸作为各种账户的“密码”。但随之而来的安全问题接踵而至,人脸识别的精准度与人们的生活及利益息息相关。若人脸识别技术的识别能力低下,便无法有效分辨不同人脸的特征信息,“人脸误刷”、“无法识别人脸”等问题便会影响人们的生活。因此选择识别精准度高的算法及参数实现人脸识别便显得尤为重要。本文将选用主成分分析法(PCA)和线性判别分析法(LDA),分别对同一人脸数据集进行不同维度的降维,然后结合SVM分类器并根据不同的核函数对降维后的数据集进行分类[4,5],各自比较识别的准确率,选出PCA中最优参数组合和LDA中最优参数组合,比较准确度后选择更优的算法及参数。
围绕上述研究目标,本文首先介绍PCA、LDA和基于向量机的理论,然后介绍模型的构建过程,接着对实验结果进行数据分析和讨论,最后对本次研究进行总结。
2  方法
2.1  主成分分析法(PCA)
PCA是一种分析统计的有效方法,该方法用特征向量对样本数据进行分析,将高维特征向量通过特征向量矩阵转换后得到低维向量[6],并略去次要信息,保存主要信息。它通过某种线性投影,将高维的数据投影至低维的空间中,且希望在投影的维度上数据的信息量最大(方差最大),以此保留较多的原数据点。识别时,将测试图像投影到低维特征空间,得到一组投影系数,通过与各个图像比较进行识别[7]。
假设有10个样本{X1,X2,....X10},每个样本有2维特征Xi=(x1i,x2i)T,每一个特征xN都有各自的特征值。主成分分析的关键求解步骤如下:
(1)对所有特征计算均值并进行去均值,计算方法如下列公式所示:
       (1)
      (2)
(xNi)’=xNi-      (3)
(2)求协方差矩阵C:
C= []      (4)
其中,cov (x1,x1)的求解公式如下:
cov(x1,x1)=      (5)
(3)求协方差矩阵C的特征值λ和相对应的特征向量u:
                 Cu=λu         (6)
(4)选取最大的前k个特征值和相对应的特征向量,并进行投影,得到降维后的新K维特征:
                  =        (7)
2.2  线性判别分析法(LDA)
线性判别分析法是一种有监督的机器学习方法,基本的思想是将带标签的高维样本投影到更低维度的空间中,使投影后的点按类别区分,相同类型的点将会在投影后的空间中更加接近,即类内离散度最小,类间离散度最大[8]。
以二分类任务为例,假设有两样本C1、C2,均值分别为μ1、μ2,投影方向为ω,则线性判别分析法的主要求解步骤如下:
 (1)求两样本间的距离:
    D(C1,C2)=        (8)
(2)求投影后样本的方差:
       Var(C1’)=      (9)
       Var(C2’)=      (10)
(3)求目标函数:
        J(ω)==    (11)
(4)定义类间散度矩阵Sb和类内散度矩阵Sw。
                   Sw=       (12)
            Sb=       (13)
(5)化简目标函数
      max J(ω)=       (14)
(6)对ω求偏导,使导数为0,得到,
     =       (15)
(7)化简需求出的特征向量即可求出投影方向ω。
     =  (λ=J(ω))       (16)
2.3  支持向量机
支持向量机(SVM)是定义在特征向量空间上求得最优的分类器,它通过建立最优分类超平面把不同的类与类的样本最大限度地区分开来[9]。训练样本线性可分时,在原空间寻找两类样本的最优分类超平面。训练样本线性不可分时,加入松弛变量并通过使用非线性映射将低纬度输入空间的样本映射到高维空间使其变为线性可分,这样就可以在该特征空间中寻找最优分类超平面。
2.4  构建模型
对下载的人脸数据集中的图片进行翻转、改变人脸图片对比度。分别调用Python所带的PCA、LDA函数,载入下载的人脸数据集,分别用PCA和LDA对数据集进行降维操作,得到降维后的数据集。完成降维后,使用SVM支持向量机分类器,调用不同的核函数对降维后数据集进行分类,得到分类后的模型。
在调用PCA进行降维时,将数据集分别降至40、80、120、160、200、240、280、320维。对不同维数的数据集,分别使用核函数为rbf、sigmoid、poly的支持向量机分类器对数据集进行模型训练,然后进行数据预测,得出预测的精度,并画出精度的折线图,然后找出最优的参数组合。在调用LDA进行降维时,因最多只能降至人脸数据类数 - 1 维[10],所以将数据集分别降至1、2、3、4、5、6维。对数据集同样使用相同的支持向量机分类器训练模型和预测数据,画出精度折线图,找到最优的参数组合。将PCA的最优组合与LDA的最优组合进行比较,得到精度更高的方案。
3  实验
3.1  人脸数据集介绍
本实验所用人脸数据集是Sk-learn的fetch_lfw_people数据集。该数据集共有7个人脸数据类,1288张图片,每张图片有1850个特征。这7个数据类的名字分别为:Ariel Sharon、Colin Powell、Donald Rumsfeld、George W Bush、Gerhard Schröder、Hugo Chavez、Tony Blair。
3.2 评价指标
使用分类后的模型来对测试数据集进行人名预测,预测完成后调用函数打印模型预测的精度、召回率和F1分数。精度越高,则模型的识别准确度越高。
3.3  结果分析
3.3.1  PCA识别结果分析
对于主成分分析算法而已,核函数的选择对模型性能影响巨大。为此,我们首先比较了不同核函数下PCA算法的识别结果,如图所示。由数据折线图得知,在PCA算法下,使用rbf作为支持向量机分类器的核函数,人脸识别度的精度更高。其中,在降至120维时精度最高。

图1 不同核函数和维度下PCA算法识别精度
我们还定量评估了PCA算法对不同人脸的识别精度,其结果如表1所示。当降维维数在120且使用rbf核函数时,PCA方法能够取得0.85的平均精确度、0.76的召回率和0.69的F1值。所有的结果表明了我们的设定对PCA算法的有效性。此外,我们还注意到模型对不同人脸的识别的精度差异巨大。以精确度为例,模型对于大部分人脸的识别精度超0.88,然而对Ariel Sharon的精度仅为0.69。我们认为上述结果的波动来自于图像分布的差异。相较于其他人脸,Ariel Sharon的图像数量较少且属于该类别的图像数量较少。

表1  PCA降维维数为120,核函数为rbf时的模型结果
 precision recall f1-score
Ariel Sharon 0.69 0.69 0.69
Colin Powell 0.82 0.88 0.85
Donald Rumsfeld 0.85 0.63 0.72
George W Bush 0.88 0.97 0.93
Gerhard Schroeder 0.91 0.84 0.87
Hugo Chavez 0.89 0.53 0.67
Tony Blair 0.94 0.81 0.87
Average 0.85 0.76 0.69

 


3.3.2  LDA识别结果分析
我们进一步比较了特征维度和核函数类型对LDA算法识别精度的影响,其结果如图2所示。由数据折线图得知,在LDA算法下,各核函数下支持向量机的分类器的分类效果差别不大,poly总体较优。其中,在降至6维时精度最高。表2中,我们同样报告了基于LDA的识别模型对不同人脸的结果,其评价精确度、召回率和F1值分别为0.64,0.62和0.63。使用PCA主成分分析法进行降维,用rbf作为支持向量机的分类器的核函数,人脸识别的准确率更高。

图2 不同核函数和维度下LDA算法识别精度


                     表2  LDA降维维数为6,核函数为poly时的数据
 precision recall f1-score
Ariel Sharon 0.60 0.46 0.52
Colin Powell 0.73 0.62 0.67
Donald Rumsfeld 0.53 0.63 0.58
George W Bush 0.78 0.82 0.80
Gerhard Schroeder 0.58 0.60  0.59
Hugo Chavez 0.56 0.60  0.58
Tony Blair 0.70  0.64 0.67
Average 0.64 0.62 0.63
     

 

 

 

 

4  讨论
从分析结果中可知,在fetch_lfw_people数据集中,对于PCA算法,使用rbf或sigmoid作为支持向量机的核函数的人脸识别准确度远高于使用poly核函数。而rbf与sigmoid相比,效果更佳,在维数为120时准确度最高,达到了0.87。对于LDA算法,使用rbf、sigmoid或poly作为核函数对于人脸识别准确度的影响并不是很大,相比之下poly核略胜一筹,在维数为6时准确度最高,达到了0.7。最后将在PCA算法下使用rbf作为核函数的折线与在LDA算法下使用poly作为核函数的折线进行比较,得出在此人脸数据集中,使用PCA主成分分析法,用rbf作为核函数,人脸的识别准确度更高的结论。
本次研究完成了在PCA和LDA算法下,对未遮挡人脸数据集的人脸识别准确度的比较任务,但尚未涉及识别遮挡人脸这一方面。在日常生活中,人脸的遮挡是一种常见行为,对于遮挡人脸的识别也是非常重要的。特别是当下疫情形式仍十分严峻,人们在生活中仍需戴口罩,提高识别遮挡人脸的准确度这一任务更应重视。未来我将对此人脸数据集进行阴影遮挡的预处理,并重新训练模型,研究在PCA和LDA算法下遮挡人脸的识别准确度。
5  总结
本文首先介绍了人脸识别这一技术的研究背景,然后介绍了本次研究所使用的PCA主成分分析法和LDA线性判别分析法的算法原理和使用PCA和LDA对数据集进行降维,然后使用支持向量机分类的训练模型的方法,接着对实验数据进行分析与比较,得出在fetch_lfw_people数据集中,使用PCA主成分分析法,用rbf作为核函数,人脸的识别准确度更高的结论,最后对实验进行讨论并对遮挡人脸的识别这一尚未研究的问题进行了展望。

 

 


参考文献
[1]姚静姝.计算机视觉在人脸识别领域中的应用[J].电子技术与软件工程,2020(17):128-129.
[2]于洋,艾秋竹,邓钧文,张柳,高天附.浅谈人脸识别的研究意义和背景[J].化工管理,2017(11):206.
[3]陈勇,林颖.基于特征脸的主成分分析人脸识别[J].计算技术与自动化,2017,36(02):122-124.DOI:10.16339/j.cnki.jsjsyzdh.2017.02.026.
[4]李昆仑,张炘.级联SVM和分类器融合的人脸性别识别方法[J].计算机工程与应用,2017,53(08):154-158.
[5]郭晨晨,朱红康.基于粗糙集理论的模糊支持向量聚类算法的改进[J].洛阳理工学院学报(自然科学版),2016,26(03):69-73+77.
[6]邓金.基于自然语言处理技术的邮件检测系统[J].数字技术与应用,2019,37(06):117-118.DOI:10.19695/j.cnki.cn12-1369.2019.06.66.
[7]韩鹏,张代远.一种基于光照方向估计的人脸识别方法[J].计算机技术与发展,2012,22(06):85-88.
[8]张勇,党兰学.线性判别分析特征提取稀疏表示人脸识别方法[J].郑州大学学报(工学版),2015,36(02):94-98.
[9]蒋桂莲.粗糙集优化支持向量机算法在人脸识别中的应用[J].信息系统工程,2020(12):77-78.
[10]何俊,芦明.一种改进的LDA和PCA特征空间融合的人脸识别方法[J].电脑知识与技术,2020,16(35):184-185+193.DOI:10.14004/j.cnki.ckt.2020.3834.

期刊巡展

合作流程 | 定制论文 | 论文发表 | 联系我们 | 关于我们 | 付款方式 | 隐私保护
百姓论文网-首页-唯一官方网站,联系电话:029-84193340, E-mail:baixinglunwen@163.com
Copyright © 2005 - 2022 EOcom. All Rights Reserved.百姓论文网-首页-唯一官方网站.职称论文发表,论文发表价格,职称论文发表价格 版权所有  陕ICP备11011549号-1
在线客服