第四节 变换编码方法

  图像变换编码的基本概念是:将在空间城里描述的图像,经过某种变换(通常采用正交变换,如付立叶变换,沃尔什变换等),在某种变换域里进行描述。一般来说,在变换域里描述要比空间域里简单,而且图像相关性明显下降,这样变换本身就能实现编码率的压缩。若再对变换域图像进行某种处理(如频域中的二维滤波)以及熵编码,则可进一步压缩图像的编码比特率。对变换处理后的图像信号施以上述对应的逆变换,即可获得空间域图像。图像变换编码一般结合采用统计编码和视觉心理编码,前者是把统计上彼此密切相关的像素矩阵通过线性正交变换变成彼此相互独立甚至完全独立的变换系数所构成的矩阵。后者即对每一个变换系数进行量化和编码。量化特性和变换比特数由人的视觉特性确定,前后两种处理相结合,可以获得较高的数据压缩率。由于图像内容千变化,即图像结构各不相同,因而变换类型和图像结构匹配程度决定了编码的效率。非自适应变换编码是与图像数据的统计平均结构匹配,而自适应的变换编码则是与图像的局部结构特性匹配。

  变换编码所产生的误差与变换类型,图像类型和尺寸以及压缩方式和程度有关。许多研究表明,二维帧内变换编码的数据压缩程度和二维DPCM大致相当。但抗信道误码能力比DPCM方法强。这是因为变换编码往往是对图像一个个小区域逐个进行。因而,误码影响在一个小区域范围内,而不是像DPCM那样扩散到一行以致多行。但变换编码的算法复杂,而且技术设备量也较大,成本高,尤其是自适应变换编码更为甚之。

  一、正交变换压缩图像编码率的物理概念

  假定把一个像素的子图像看成为维坐标系中的一个坐标点,也就是说,在这个坐标系中的每一个坐标点对应于 个像素。这个坐标点数值是其对应的 个像素的亮度结合。以 像素构成的子图像(即相邻两个像素组成的子图像)为例,设每个像素取8个灰度级(3比特量化)。以图 5-4-1(a)中的 轴表示第一个像素可能了的8个量化层。由组成的二维坐标系中每一个坐标点对应于一个 子图像,该点数值由两个像素的亮度所组成。因此总共有种可能的亮度组合,由图5-4-1(a)中的64个坐标点表示。对一般图像而言,绝大多数的子图像中相邻两像素其亮度级相等或很接近,也就是说在 直线附近出现的概率大。或者讲,绝大多数子图像出现在图5-4-1(a)中的阴影区。



图 5-4-1 正交变换的物理概念

  现在将坐标系逆时针旋转,如图5-4-1(b)所示。在新的坐标系中,概率大的子图像区是位于轴附近。由此表时,变量之间的联系比起变量 之间的联系,在统计上更加相互独立。而且方差也重新分布。在原来坐标中子图像的两个像素具有相同的方差,而在变换后的坐标系中,。这种变换后坐标轴上方差不均匀分布正是正交变换编码能够实现图像数据压缩的理论要据,也就是利用图像数据的统计特性进行统计编码。若按照人的视觉特性,只保留方差较大的那些变换系数分量,如图5-4-1(b)中 ,就可以获得更大的数据压缩率,即所谓视觉心理编码。图像在 维变换域中,相关性大大下降。在一些坐标上有较大的系数方差,而在另一此轴上系数方差则较小 。用这些坐标变换系数编码 ,将比直接使用原图像编码获得更大的数据压缩。

综上所述,图像正交变换实现数据压缩的物理本质在于:经过多维坐标系中的适当的坐标旋转和变换,能够把散布在各个坐标軕上的原始图像数据例如图 5-4-1中阴影区,在新的适当坐标系中,集中到少数坐标轴上,因此可能用较少的编码比特来表示一幅子图像,实现高效率的压缩编码。

  二、变换编码原理框图

  变换编码原理框图见图5-4-2



图 5-4-2 变换编码原理框图

  变换编码工作过程从图 5-4-2明显可见,由于变换图像像素之间的相关性大大下降,其能量集中在变换域少数变换系数上,这本身已经达到了图像数据压缩的效果,为了进一步提高压缩效果,可以再结合视觉心里编码。如采用“ 区域抽样 ”方法,只保留变换系数 中那些幅度大的元素。虽然数量很少,但往往占有绝大部份能量。而对其它幅度小的数量大的变换系数,可以全部当作是零 ,不予编码 。这样就可以减少图像数据率。若再辅以非线性量化,还可以再进一步压缩图像数据率。不过由于变换编码系统中量化器的存在,之间必然存在量化误差,从而引起输入图像 和输出图像 之间也必然有误差存在。因此这种类型的变换编码属于非信息保持编码。若取消量化这个环节,则这种变换编码即可成为信息保持性质的图像编码。

  三、几种常用的变换编码的简单介绍

  关于图像正交变换的算法本身已在第三章中介绍过,下面仅就变换编码中有关问题略加说明:

  (一)二维付立叶变换编码

  图像经过二维付立叶变换后,其变换系数矩阵即二维频谱如图 5-4-3所示



图 5-4-3 二维付立叶频谱分析

  图 5-4-3(a)、(b)分别为原点取在中心和左上角的二维付立叶频谱分布,也就是表明:若变换矩阵 原点设在中心,其频谱能量集中分布在变换系数矩阵的中心附近(图中阴影区)。若所用的二维付立叶变换 的原点设在左上角,那么图像信号能量将集中在系数矩阵的四个角上。这是由于 轴都是共轭对称的二维付立叶变换本身性质决定的。同时也表时一般图像能量集中低频区域。

  图像的付立叶变换 ,由于其变换本身有多种成熟的快速算法(FFT算法),而且性能接近于最佳,从而获得较早的也比较广泛的研究。它的不足之处在于 :相邻子图像数据在各个边界不连续造成的所谓Gibbs现像。这是由于图像数据的二维付立叶变换实质上是一个二维图像的付立叶展开式。当然这个二维图像应被认为是周期性的。由于子图像的变换系数在边界不连续 ,而将造成复原的子图像在其边界也不连续 。于是由复原子图像构成的整幅复原图像将呈现隐约可见的以子图像尺寸为单位的方块状结构,影响整个图像质量 。当子图像尺寸较小时更为严重。解决这个Gibbs现像的方法是后来研究出来的二维余弦变换(DCT)代替二维付立叶变换。基本思路为:用一个对称的 像素的子图像代替原来 子图像。由于对称性, 子图像作二维付立叶变换,其变换系数将只剩下实数的余弦项。这样,即可消除Gibbs现像。

  二维付立叶变换编码误差来源主要有:变换系数经过量化器而引起的量化误差;采用“区域抽样”方式,使其高频成分被假定为零(相当于二维低通滤波,由于高频分量丢失引起图像模糊);付立叶变换编码对相邻的子图像变换并非位移不变运算,因而在相邻子图像交界处将引起一定程度的边缘效应。

  (二)二维沃尔什──哈得玛变换编码

  二维沃尔什 ── 哈得玛变换简称沃尔什变换。与付立叶变换相比,其算法简单(只涉及加法和减法)。因而运算速度快,适用于高速实时系统,而且也容易硬件实现。

  由于二维沃尔什变换域中数值大的变换系数也都集中于低频区域,因此采用区域抽样和区域编码同样可以达到图像数据压缩的目的。

  图5-4-4(a)示意区域抽样方法,即只对左上角区域里的变换系数抽样编码。而右下方阴影区中变换系数全部假定为零。图5-4-5(b)示意区域编码方法,即把变换系数矩阵分成若干个区域,每个区域编码比特数由该区域中变换系数的能量大小决定。一般变换系数能量大的区域用较多的比特编码,否则反之。



图 5-4-4 区域抽样法和区域编码法

  另外作为变换编码其子图像(像块)尺寸选择往往十分重要,而且总是首先需要确定。若像块尺寸选得太大,超过图像的相关距离,则可能得不到更多的好处。而且为采用自适应技术带来麻烦,因为自适应技术总是要匹配于子图像结构。若像块尺寸过小对图像变换去相关不利。一般图像变换典型像块尺寸为像素,近来也有选用高达像素的。

  关于变换编码自适应技术,一般算法都很复杂,硬件实时实现也有较大困难,不再详细介绍。大致有:阈值自适应法,即对某些图像细节多的像块,由于高频分量被剥削假定为零而造成失真较大。对这类像块除保留低频区域变换系数外,再保留一些大于某个“阈值”的一些高频分量进行编码。这个“阈值”大小随像块结构而自动调整,以达到自适应效果。还有像块尺寸自适应技术,变换系数预测法自适应等。

  通信系统中误码对图像变换编码影响小于 PCM或DPCM编码。这是因为复原子图像是各个变换系数对基本图像的加权和。因而少数误码使变换系数产生的差错被分散到复原子图像的各个像素上,而且也限于该子图像。对高质量的图像,一般DPCM编码要求信道误码率不大于 ,而变换编码只要信道误码率不大于