二维Gabor小波的定义为:
(2.1)
式中:是与小波频率带宽有关的常数;为空间位置坐标;确定了Gabor内核的方向和尺度。在采用8个方向和5个尺度的采样时,某人方向和尺度上的可以写为。其中为采样尺度,为尺度标号;为采样方向,为方向标号。为最大频率,是频域中的内核间隔因子。令参数、、,可以获得较好的小波表征和辨别效果。
Gabor变换与Gabor内核的卷积为:
(2.2)
设的幅值和相位分别为和,则。组合不同尺度和方向的,构成图像在位置处的Gabor特征矢量。
定义Gabor特征和在不考虑相位差时的相似性为:
(2.3)
在提取人脸图像的Gabor特征时,通常采用多个在不同尺度和方向上的Gabor滤波器组成滤波器组,并根据图像的特点和神经生理学的结论来选择参数。通常研究采用共包括8个方向(;)和5个尺度(;;)的Gabor滤波器组,并令,使滤波器的带宽约为1倍频程。
由于Gabor特征具有良好的空间局部性和方向选择性,而且对光照、姿态具有一定的鲁棒性,因此在人脸识别中获得了成功的应用。然而,大部分基于Gabor特征的人脸识别算法中,只应用了Gabor幅值信息,而没有应用相位信息,主要原因是Gabor相位信息随着空间位置呈周期性变化,而幅值的变化相对平滑而稳定。所以本范文将输入图像依次与滤波器组的各个滤波器进行卷积,并取其幅值作为输出,即
, (2.4)
设图像的大小为,通过40个滤波器得到Gabor特征的维数高达,计算量很大,且由于Gabor特征在相邻像素间是高度相关和冗余的,所以通常只需要稀疏的提取部分节点上的Gabor特征。
一个人脸图像经Gabor变换后就得到幅值特征和相位特征的维数都是,计算量很大,而且Gabor特征在相邻像素间是高度相关的,所以必须对Gabor特征进行降维。本范文所采用的降维方法就是对Gabor变换系数进行简单的下采样,如对Gabor特征进行固定行固定列均匀分布采样。
提取单幅人脸图像的Gabor特征的基本步骤如下:
划分Gabor特征的采样点
本范文划分的采样点的个数为40*30 =1200个,采样点数目较多,目的是为了得到更加清晰的Gabor图像。划分采样点后的人脸图像如图2.2所示:
图2.2(a) 原人脸图像 图2.2(b) 划分采样点后的人脸图像
由于得到的Gaobr特征的维数较大,下面实验将采用均匀下采样对Gaobr特征进行处理,从而达到降维的目的。
提取人脸图像的Gabor特征
本文采用40*30 =1200个规则分布的采样点,在采样点上提取各个滤波器输出的值,联合起来组成列向量,从而得到每幅图像的Gabor特征向量,并以此作为该人脸图像的局部特征向量。得到的人脸图像的Gabor特征如下图所示:
图2.3(a) 单幅人脸图像的Gabor幅值特征 图2.3(b) 单幅人脸图像的Gabor相位特征
由以上图像可见,与原图灰度值随位置的变换相比,滤波器输出的幅值随位置的变化要更小更不敏感;Gabor相位信息随着空间位置呈周期性变化,而幅值的变化相对平滑而稳定。因此,即使采样点稍有偏移也不会使提取出的特征值发生太大变化。也就是说,Gabor特征具有良好的空间局部性和方向选择性,而且对光照、姿态具有一定的鲁棒性,可以容忍更大的器官定位和对齐误差。
3 奇异值特征提取算法的实现
3.1 人脸图像的奇异值特征
一个典型的模式分类系统包括预处理、特征提取、分类三部分。一个理想的特征提取器应该产生一个表达,以使得后续分类器的工作变得简单。通常情况下,特征的数目几乎总是少于用于描述完整的感兴趣的目标所需的数据量,特征选择和特征提取的基本任务是如何从许多特征中找出那些有效的特征。
特征提取是模式识别中的关键,其目的是获取特征数目少而分类错误概率小的特征向量[19]。由于在很多实际问题中常常不容易找到那些最重要的特征,或者受条件限制不能对它们进行测量,这就使特征提取的任务复杂化而成为模式识别系统最困难的任务之一。特征提取的目的是获取一组“少而精”的分类特征。从统计特征方法考虑,目前用于图像识别的特征提取方法一般可以分为:
(1)直观性特征:如图像的边沿、轮廓、纹理和区域等。这些都属于图像灰度的直观特征,物理意义明确,提取比较容易。
(2)灰度的统计特征:如灰度直方图特征,将图像看作一种二维随机过程,引入统计上的各阶矩阵作为特征来描述和分析图像是目前普遍采用的方法。众所周知的有Zerk 矩等。
(3)变换系数特征:对图像进行各种数学变换,可以将变换的系数作为图像的一种特征,如离散余弦变换、傅立叶变换、霍夫变换等在图像特征抽取方面均有广泛的应用。
(4)代数特征:反映了图像的一种内在属性,将图像作为矩阵看待,可对其进行各种代数变换,或进行各种矩阵分解,由于矩阵的特征向量反映了矩阵的一种代数属性,并且具有不变性,因此可以用来作为图像特征。如KL变换或主分量分析,实际上就是以协方差矩阵的特征向量作为空间基底的一种代数特征提取。
基于奇异值特征的人脸识别方法是由Hong首先提出来的。他们将人脸特征分为视觉特征、统计特征、变换系数特征以及代数特征四类,代数特征反映了图像的本质属性。因为图像本身的灰度分布描述了图像的内在信息,所以可以将图像作为矩阵看待,进行各种代数和矩阵变换后提取的代数特征是人脸的表征。奇异值分解是求解最小二乘问题的一种有效工具,在数据压缩、图像处理以及模式识别等方面得到了广泛应用,为提取人脸代数特征提供了一种有效的手段。
矩阵的奇异值特征是一种有效的代数特征抽取方法[20]。奇异值之所以能够作为一种特征在图像识别中应用,其理论依据是:图像的奇异值具有良好的稳定性;奇异值反映了图像的一种代数本质,这种本质不是直观的,而是一种内在属性;奇异值具备代数和几何上的不变性。因此,矩阵的奇异值分解(SVD)是一种有效的代数特征抽取方法,已经在图像数据压缩、信号处理和模式识别中得到了广泛的应用[19]。
许多研究表明,矩阵的奇异值分解(SVD)是一种有效的代数特征抽取方法,已经在图像数据压缩、信号处理和模式识别中得到了广泛的应用。
任何一个实对称方阵都可经正交变换转化为对角阵,对于任意实矩阵,则可利用奇异值分解(SVD)将其转化为对角阵。
定理(SVD) 令是实矩阵(不失一般性,设),且,则存在两个正交矩阵和及对角阵使下式成立:
(3.1)
其中,,,
,
,
而称为矩阵的奇异值,是并且也是的非零特征值的全体,而为的个零特征值。,分别是和对应于非零特征值的特征向量。是为了表达上的方便而引入的个向量,可以设想它是对应于的特征向量。同理,为对应于的特征向量。将式(5)写成卷积的形式:
(3.2)
如果矩阵代表一幅人脸图像,式(6)就是对该人脸图像进行了正交分解,将矩阵中主对角线上的奇异值元素连同中剩余的个0构成一个维列向量:
(3.3)
其中,为中第一个阶子式,列向量,称为的奇异值特征向量(SV特征向量)。对于任何实矩阵,在的限制下,奇异值对角矩阵是唯一的,因此,原人脸图像对应于唯一的SV向量。
3.2 奇异值特征向量的重要性质
奇异值特征向量具有下列的重要性质[20,21]:用SV特征向量来描述人脸图像是稳定的;SV特征向量的转置不变性(即对图像矩阵作转置运算,SV特征向量不变)、旋转不变性(即对图像矩阵作旋转运算,SV特征向量不变)、位移不变性(即对图像矩阵作行或列的置换运算,SV特征向量不变)、镜像变换不变性等。下面对各性质进行证明。
(1)奇异值特征向量的稳定性
由于SV特征向量与原始人脸图像的一一对应关系,因此可用SV特征向量描述人脸图像。显然,能采用SV特征向量描述人脸图像的另一个关心的主要问题在于SV特征向量是否稳定;即当图像的灰度出现小的变化时,其SV特征向量是否会出现大的变化,若不出现大的变化,则称为之稳定的。SVD扰动分析表明,SV特征具有良好的稳定性,下面的定理说明了这一点。记是所有阶实矩阵的全体。
定理 设的奇异值分别是,则对于任何一种酋不变范数,有
(3.4)
定理中的酋不变范数如果取为Frobenius范数,则8式成为
(3.5)如果取为谱范数,则8式成为
, (3.6)
由于奇异值特征向量具有良好的稳定性,所以它对图像噪音、图像光照条件变化引起的灰度变化具有不敏感的特性。
(2)奇异值特征向量的转置不变性
根据SVD定理,有
可见,和有相同的奇异值,即对应同一个奇异值特征向量。
(3)奇异值特征向量的旋转不变性
首先引入初等正交变换,形如的方阵称为初等正交矩阵,或Householder变换,其中为单位矩阵,是实维单位列向量。
任一旋转变换矩阵都可以分解为两个正交矩阵的乘积。设原始图像矩阵为,对其作旋转变换相对于对左乘一正交矩阵,得到的图像为。于是有
(3.7)
其中。可见对的正交变换导致了对(或)作正交相似变换,由于和有相同的特征根,因此图像和旋转后的图像有相同的奇异值特征向量。
(4)奇异值特征向量的位移不变性
对图像的位移变化归结为对图像矩阵做行(或列)的置换,变换矩阵的第,两行等价于在该矩阵的左边乘上矩阵
其中和分别表示单位矩阵第列和第列,变换后的矩阵为。已知,于是的特征方程为
基于特征融合算法的人脸识别(二)相关范文