文献综述
现状:随着我们进入信息化时代,计算机的运算速率不断提升,所能存储的容量不断扩大,使得计算机的视觉图像研究逐渐成为现实。用于研究关于模仿人类视觉图像的相关技术可以统称为计算机视觉技术,简单地说计算机视觉就是根据图像的数据信息与符号相关联的描述过程,共分为三个级别分别是:顶级处理级别、中级处理级别和初级处理级别,对图像最基本的操作像对比度和降噪处理操作都被称为初级处理级别。对图像进行基础操作之后就可以进一步进行细化操作,即对图像进行分割和对分割后的图像进行简单的描述过程,这就是中级处理级别。将处理的结果用便于计算机数据分析的语言描述出来,我们既可以根据分析出的图像相关特征属性对图像所含有的内容进行识别和分类,进而达到一定的预期效果,例如数据挖掘、目标检测、图像识别等,这一系列过程就成为顶级处理级别。在我们的日常生活中图像处理技术可以说是与我们的生活密不可分的一部分,大多数计算机的图像处理都是基于其图像特征属性的有效描述和分析来完成的,例如在处理案件时会对收集到的罪犯图片与监视器所拍摄的图像集成库中的图像进行对比和识别,为追捕罪犯提供帮助。
由于各式各样的安全技术受到人们的关注,人脸作为特有的身份特征,因其面部数据信息极易获取而具有了非交互性等长处。基于人脸的非交互式的身份识别,可应用于飞机场、火车站等人流密集处方便识别逃犯或者恐怖分子等人员面部图像。目前.人脸识别的方法种类繁多,根据识别方式可以分为两类:基于全局特征和基于局部特征的识别方式。在基于全局特征的识别方式中,基本方法是从完整的人脸数据中提取对应的特征信息,例如:主成分分析技术(PCA)、线性判别技术(LDA),独立成分分析技术(ICA)等。通常情况下是先通过部分的数据训练以构造一个特征子空间,再对用于测试的数据,将其映射到该特征子空间中并用某种匹配方法对数据信息进行匹配。基于局部特征的识别方式,主要是从人脸图像上的某些采样点周围提取有效的局部几何特征,通常有局部特征的描述符,曲线特征以及曲率特征。通常是将向量、曲率、曲线几类基本的几何特征用以构造相应的局部特征。在对局部特征进行构造前.需要要确定人脸图像中的相对稳定的点,叫作关键点,接下来再再关键点周围近邻中,选取一定区域内的点来构造特征。
在计算机视觉中人脸识别是一个长期存在的研究课题。尽管已经花费了大量的研究精力在人脸识别的问题上,但它仍是一个具有挑战性的问题。通常由于各种内部类的变化(例如:人脸表情、动作姿势、年龄、图像杂质等)或者缺乏足够的训练样本而导致这些挑战的产生。为了能够达到可支持的识别精度,人们认为关键是要找到有效的和健壮的面部图像表示方法。传统的面部图像特征方法包括:特征脸、Fisher脸、Laplacian脸等。在某些任务中这些特征方法工作性能良好。然而上述方法往往无法很好的应对,例如:图像遮挡、大范围的姿态变化等问题。
现如今已经是大数据时代,每天都会在网络中产生大量的数据信息,而对于数据的分析和处理是现在急于需要解决的难题,在这些数据信息中最为普遍的就是图像信息,从拍摄照片到视频剪辑无一不是图像的堆积,所以对于图像的处理也已成为广泛研究的内容之一,在大量的应用中为满足人们诸如图像处理、电子商务、数据挖掘等要求,一种有效而又便捷迅速的人脸图像识别方法是迫切需要解决的课题。最近几年,针对人脸面部图像的识别已经逐步迈出了实验阶段正想着实践阶段进发,2009年底,Google公司研发了一款基于内容的图像识别系统,被应用于手机等移动设备,使用起来相对简单。另外微软、eBay、IBM也分别研发了各自的图像识别系统。由于我国在对图像识别技术的研究进展远落后于国外,所以还未出现令人满意的自主技术。
为了加强人脸的识别提出了一种新颖的BBOW(block-based bag of words)方法。在BBOW方法中,一个脸部图像被划分成多个块,在每一个独立的块中,密集的SIFT特征被用来计算和矢量化到不同的字码中。最后,分布在每一个局部的块中的字码的直方图被连接起来表示人脸图像。基于AR数据库的实验结果表明只有在使用一种中性表达式的人均框架来训练,我们的方法通过极端的表达式、不同的光照强度和局部的遮挡来获得更好的人脸图像的识别结果。基于XM2VTS数据库我们的方法也能够实现平均100%的识别率。
人脸识别因为其在法律执行、监视和人机交互的潜在价值已经成为最活跃的研究领域之一。主要方法是:使用完整的人脸区域作为输入到识别系统中并且使用PCA、LDA或者ICA构造一个子空间。最近地,从局部区域的人脸特征提取面部图像的局部匹配方法已经展现了较好的前景。然而,一个实用的人脸识别系统需要加强对不同条件的处理,例如表情、光照、阴影等等。工作中解决上述问题会受到影响,但是它们中的一部分通常情况下可以解决各种各样的条件,并且性能仍然需要改进,尤其是在极端表达式和遮挡的条件下。我们提出了一种新颖的BBOW方法,该方法用来加强多种的表达式、光照和遮挡,即使只使用一个单一的人均框架来训练。词袋模型方法:表示一个图像作为一个无序局部特征集合,已经展示了令人印象深刻的对象识别能力。然而,在脸部识别中对象的图像属于同一类别(脸部图像),来自整张人脸的无序局部特征的直方图没有足够大的类间变化。在我们的工作中,我们将面部图像划分成多个块并且在每一块中提取密集的SIFT特征。然后我们应用聚类方法将SIFT特征转换成字码直方图来表示不同的局部面部的块。最后,我们将每个块的直方图连接起来并用线性SVM支持向量机分类人脸。实验结果表明,我们的方法加强了对多种不受约束的条件并优于其他近期的作品。
词袋模型最早应用于对文本的处理,其基本思想是将文档中的文本信息转换成由一系列乱序关键词组成的集合,通过汇总其中每个关键词所出现的次数,计算相应的频率数值的表示文档,来完成文本的归类任务。Csurka等学者使用文本分类中用到的Bag-of-Words方法,将词袋模型应用到目标识别。词袋模型主要步骤依次是:视觉词典的构建、局部特征的编码、编码矢量的汇聚。
近期,词袋模型方法在应用于目标识别方面已经取得成功。在词袋模型中,几个无序的局部补丁被首先从不同类别的图片中提取出来作为基本候元素的候选单词。然后特征描述符被应用于代表数字向量的补丁。最后一步,为产生一个字码本使用聚类方法将这样的向量转换成字码。然后字码被用来定义为学习集群的中心。字码本的大小由集群的数量决定。因此,一个图像的每一个补丁通过聚类过程被映射到一个特定的字码并且该图像可以用字码直方图表示
受关注最多的就是针对面部图像的正脸研究,主要经历了三个发展时期:对人脸面部特征的识别、基于机器识别的研究、以及人工智能的图像识别,其中最为基础的就是针对面部特征的识别,这一环节只需要一条简单的指令使调试人员与对应的图像库关联到一起,并使用某种分类分析技术已达到识别的效果,在此基础之上相对加深的研究就是基于计算机视觉技术的研究,在一环节里充分体现了人机交互的有力一面,操作人员会对将要识别的图像进行参数特征转换,并将面部图像以矢量的方式表示出来,再输入到已经编译好的识别系统中进行面部图像的识别,针对识别系统进行拓展就有了现阶段较为流行的智能识别机制,这里就引入了智能自动机器识别技术,这也是当前被广泛应用于识别系统的技术之一,这一技术大大加快了对于图像的识别速度,远远提高了识别效率,其中根据面部图像表示方式的不同,共包含:基于关联方式、几何特征和基于参数特征三种不同的识别方法。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。