- 文献综述(或调研报告):
人脸动作识别作为对面部动作单元进行特征提取和分析的一项技术,该技术拥有非接触式、普适性、操作便捷等特点,在智能人机交互(human-computer interaction, HCI)、教育医学以及心理学等诸多领域所具有很高的理论或实践价值,可以预见,人脸动作的分析和识别技术在当今时代存在着广阔可观的应用前景和巨大的市场价值。在近几十年以来,该技术在学术界和工业界备受关注,成为机器视觉与图像处理的研究热点之一。
人脸识别技术主要由两个关键步骤组成:人脸动作特征的提取以及对其进行分类。人脸动作特征的提取的精确度直接影响了整个算法的鲁棒性,所以获取更好的面部特征成为当前人脸动作识别的重要内容。从图像中提取的面部特征主要分为三类,几何特征,外观特征以及混合特征(几何与外观两者结合使用)。
几何特征就是面部组件单元或特征点的形状与位置数据,常用的几何特征提取方法有:多状态模型,主动形状模型,活动外观模型,尺度不变特征变化(SIFT算子)法等。
多状态模型是由Tian等人开发出一种多状态面部组件模型(MFCM) 用来检测与跟踪正面人脸图像中面部组件的变化。在一个给定图像序列中,人脸区域和面部各个特征大致位置可以在第一帧中被自动检测出来,同时使用不同数量的状态模型描述各个面部组件的状态,如用打开,闭合和紧闭三种模型形容嘴巴的动作状态,用存在和不存在两种状态描述法令纹等皱纹。多状态模型分别使用15个和9个参数形容人面部的上下两部分来描述面部组件以及皱纹的运动状态。之后在第一帧对这些数据进行手动调整,在初始化之后,所有参数按当前值与参考帧中的比值进行计算,这样图像序列所有的面部特征的变化就都可以被自动追踪与检测。
主动形状模型(ASM)是cootes等人于1995年提出的一种基于点分布(PDM)的特征匹配方法,用来模拟图像中的物体外观和形状的变化。ASM通过将适合的点分布拟合到研究对象上,从而确定对象的形状,比例和姿态。该算法相对于多状态模型改进在于ASM算法由训练和搜索两部分组成的,首先要对训练集中的每张图像都提取k个人脸的关键特征点的位置信息,并将这些信息构成一个形状向量,接着利用普氏分析方法对人脸形状进行归一化及对齐,将对齐后的向量用主成分析法处理,为每个特征点构建了局部特征。搜索过程则是通过计算每个特征点的位置,更新仿射映射中的矩阵参数和向量b并设定参数与向量b的阈值来实现的。
然而,ASM算法只是利用了对象的形状信息,并没有使用其他面部信息,因此ASM算法的准确度并不理想,Coots,Timothy.F等人于1998年在ASM算法的基础上加入面部重要纹理信息(如对象像素)作为参考进行数据分析提出了活动外观模型(AAM)。
之后,David G.Lowe在1999年提出了SIFT算子并于2004年完善了尺度不变特征转换算法。尺度不变是指使用SIFT算子提取尺度空间的局部特征时,不仅对于图像的尺度变化具有不变性,旋转,缩放和亮度变化甚至仿射变换都具有不变性。通过对图像尺度变换构建高斯差分空间(DOG)并在3*3的邻域内进行像素点比较,找出极值点,同时消除掉对比度低和边缘响应不稳定的点,向这些筛选后的关键点分配方向信息,即以其为中心的邻域内所有点的梯度方向的统计信息,这样图像旋转后关键点仍有不变性。接着将坐标轴与关键点方向对齐,以关键点为中心计算邻域内梯度并用高斯函数进行滤波计算,生成关键点描述子。最后根据SIFT特征进行匹配,当计算出两张图像的关键点的128维描述子的欧式距离小于设定阈值时,即为图像匹配成功。Berretti等人提出了基于SIFT特征描述子提出了一种自动面部动作识别算法,为需要识别的动作训练一个支持向量机(SVM),并将其组合为一个多分类器,该方法在BU-3DFE数据库上可以达到78.4%的平均识别率。
外观特征是用来表示面部的皮肤纹理变化,如面部动作引起的皮肤褶皱等。常用来提取外观特征的方法有三种:局部二值模式,Gabor小波变换以及深度卷积神经网络。
局部二值模式(LBP)是将图像转换成一个整型标签或数组的图像,属于一种图像描述算子,经典的LBP算子是在3*3的像素块中,通过与中心点像素灰度值进行阈值比较得到标签,而Ojala等人在此基础上进行完善,提出对中心点邻域的大小以及数量没有限制的圆形LBP算子,来满足图像不同尺度的纹理特征。接着他们又幵发出了LBP旋转不变模式和LBP等价模式,压缩了处理数据,减少了图像中高频噪声的干扰。Liu等人提出了一种灰度像素值和局部二值模式特征相结合的算法,采用softmax归分类器对六种面部表情进行分类,在CK 数据库上达到了了96.3%的平均识别准确率。
Gabor小波变换则是用来计算空间频域,其基本思想是:把信号分割成多个较小的时间间隔(对信号加窗),用傅里叶变换分析每个时间间隔,以便于在该时间间隔确定频率。因此Gabor 很适合纹理信息的表达和提取,甚至可以模拟大脑初级视觉皮层细胞接收图像信号的特性,能够允许在多尺度和多方向上检测直线边缘,且消除图像中光照变化产生的影响。但与此同时,为了有效分析各个尺度和方向的灰度变换,会导致产生大量的卷积运算,占据计算内存还会加大时间损耗。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。