第五节 几种新型数字图像处理系统

  一、引言

  由于数字图像处理技术日益深入到各个领域。从遥感图片处理、医用图像识别、工业产品检查以及装配工序中的图像测量,到最近应用的办公室自动化中的图形和图像的生成及文件图像处理、全天候传感器合成孔径雷达的数字分析以及三维活动图像的分析,特别是近来广为议论和研究的机器人视觉,都已越来越使人们感到图像处理技术的重要及带来的益处。正是由于数字图像处理技术的广泛应用,对实现处理的系统提出了各种新的课题,使一些新的系统组成及结构,如并行处理、胞室逻辑图像处理、微机处理阵列、高速大规模集成电路处理硬件、图像数据库等得到了极大地重视和迅速地发展。

  数字图像处理的信息具有数据为二维排列、信息两庞大、对每个象素经常进行相同的处理等特点,因而用现在生产的序贯型(顺序型)计算机来运算处理本质上是不合适的。特别是当需要处理的图像尺寸较大、帧数较多或构成实时处理装置时更不适应,这就需要新型结构的计算机,如并行处理机,来提高处理速度和处理能力。

  从当前的硬件和软件的研究开发情况来看,有以下几个方面的研究十分活跃,并已取得了显著的成就,有不少新型系统投入了使用。

  首先是采用并行处理机来代替当前的顺序型计算机,可以大大地提高处理速度,而且在大规模集成电路迅速发展的今天,不仅可方便的实现,其成本也很低。这是一个十分引入注目的新的研究方向。典型的例子如英国伦敦大学研究的胞室逻辑图像处理机CLIP-3和CLIP-4。

  随着微电子学的迅速发展,微处理本身的结构开始出现很大的变化,它打破了传统的结构形式,向并行、实行处理方向迈出了很大的一步。如近几年已出现了单片信号处理器,典型产品如美国TEXAS公司生产的TMS320系列信号处理器。它的主要特点是将算术逻辑单元、并联乘法器、控制器和相当容量的RAM集中在一块芯片上。其时钟为 ,指令中无等待周期。处理速度已达每秒可执行5兆指令,可用于实时图像处理。

  另外,利用微处理器的尺寸小,价格低廉、耗电少等优点,用几十个,甚至几百个微处理机阵列来进行图像处理和识别。这样既可以保证高速图像处理和识别分类,又保持通用计算机的功能。这也是一个值得重视的新研究课题。

  最后值得一提的是国外有些单位近年来采用超大规模集成电路技术直接研制出各种图像处理功能部件(单芯片处理器),如 边缘检出器、拉普拉斯算子滤波器、中值滤波器、低通或高通滤波器等单芯片处理器。同时,在软件上开发研究图像数据库,专用图像处理软件等,都已取得了不少新的成就。

  二、并行处理机

  当前顺序型计算机进行计算是按串联方式进行的。它的基本结构只允许每个瞬时对二个数作一次运算,当运算的数据多于两个时,就得用程序进行串联序列按步动作。如用这种顺序型计算机对二维数据结构的图像信息进行处理,只能对所有的象素进行逐点运算。但是,当分辨率要求越高,象素越多,所需存储器容量就越大,其处理速度也越慢。

  由前述可知,在数字图像处理中,对每一个象素的处理是基本相同的,仅是在时间上不同(按时序进行)。因此,可以采用一定的结构方式,同时对各象素进行处理,从而大大地提高了处理方式,这就是平行处理的方式。实现并处理的计算机一般称为并行处理机。

  并行处理机通常属于单指令流多数据流(SIMD)计算机。程序存储器存储要进行处理的程序,其程序顺序地送至控制部分。控制部分把指令码后,控制各处理单元的操作。此时各处理单元作同一中操作,但数据来自各个不同的数据存储器,结果也送至相应的存储器内。处理单元之间通过联络网络互相传递数据。这类并行处理机一般进行通用的处理,如矩阵或矢量运算、噪声去除、几何校正、轮廓增强、卡尔曼滤波等处理运算。

  最早研制的并行处理机是六十年代末美国伊利诺斯大学设计的ILLIACIV处理机。典型的并行处理机是美国Goodyear宇航公司1982年研制成功的MPP(Massively Parallel Processor)巨型并行处理机,用于高速处理遥感卫星图片。

  三、胞室逻辑图像处理机(CLIP)

  胞室逻辑图像处理机(Cellular Logic Image Porcessor──简称CLIP)是并行处理机的一种,它实现图像数据的并行处理。它的特点是每个象素对应着一个胞室处理单元进行运算处理,整个图像处理机就是一个胞室处理单元阵列所组成。此阵列一般很大,都以大规模集成电路来组成胞室处理单元。

  (一)胞室逻辑的概念

  用胞室逻辑进行并行图像处理具有以下两个特点:

  1.对应图像中的每个象素,必须要有一个处理单元(Processing Element──简称PE)。

  2.这种处理单元与对应象素的相邻象素有关,我们将这种领域结构称为“胞室”(cell)

  胞室逻辑运算是实现图像各象素的并行运算。它可定义为:用数字的方法将一个二维阵列 ,新阵列中每一元素的值由原阵中相应元素及其领域的值来决定。胞室逻辑运算在数字图像处理中是经常遇到的,如二维FFT、图像平滑、梯度锐化、轮廓跟踪等。这些处理运算,都与象素及其领域象素的值有关。

  胞室逻辑处理单元(PE)实际上就是与一个胞室有关的逻辑运算电路和与之相关联的内部存储器组成。由PE组成的阵列称为CLIP。

  (二)胞室逻辑处理机的基本原理

  CLIP是由处理单元PE组成的阵列,一个处理单元对应着一个象素。每个PE从输入设备(如电视摄像机)输入数据,并从领域接受有关数据,通过PE中的一些逻辑电路对这些数据进行处理,并在PE中的存储器存储处理的中间结果,以备进一步处理。得到的处理结果有二个去向:一个送入近邻单元;另一个就作为处理后的新图像值。这种逻辑阵列的好坏取决于PE彼此联接的方式、内部逻辑和内部存储量三个因素。这三种情况越好,处理能力就越强,但结构也复杂。不过随着大规模集成电路的发展,这个问题正在逐步得到解决。

  CLIP中各处理单元的联接方式有六角形、方形和八角形三种接发,如下图所示。下图(a)表示六邻接的六边形阵列,这在扫描方式中很容易得到,只要将奇偶行错开半个象素距离即可获得。下图(b)和(c)表示四邻接的正方形阵列和八邻接的八角形阵列。在实际的CLIP机器中,这些邻接关系可以用程序互相转换。



图 11-5-1 PE的邻接关系

  (三)处理单元结构举例──CLIP-3阵列

  典型的CLIP是英国伦敦大学研制的CLIP-3组成的阵列。它处理的图像是二进制图像,主要用于血球细胞分类、计数。

  CLIP-3阵列共有 个处理单元。完成一次指令只需 ,相当于一象素以序列动作时间为 ,也就是每秒执行 次象素操作。

  CLIP-3是由一系列指令控制的,指令存贮在RAM中。这种指令一般分为五类:存入指令、处理指令和三种分支指令。编程序用一般符号语言编写,它们的格式为:

  1.“存入”(LOAD)指令格式为

  LD X,Y,Z。

  其中 表示从存贮器 中取出图像(A)值( 存贮器存放象素值),即表示将 地址中的内容送入A缓冲器; 表示从 取出图像(B)值,即表示将 地址中的内容送入B缓冲器;Z表示下一步处理后的象素值,它存入 位置中。任何位置,在清除后就用C表示。

  2.“处理”(Process)指令格式为

  

  其中THR为阈值,用0-7中任一数字表示; 为近邻关系,对八近邻为1-8,六近邻为1-6,其次序如下图所示;W为近邻输出N的逻辑功能;Z为图像处理后输出D的逻辑功能,其逻辑功能以P和A输入的逻辑表达式表示。TES 表示网络形状,EDGE(用E表示)表示有无N输入。当有E时,表示边缘象素在边外的规定联接方向有N输入;无E时,表示无N输入。

图 11-5-2 CLIP阵列近邻联接次序

  3.三种“分支”(BRANCH)指令

  该类指令表示当满足一定条件时,程序的执行转向另一地址的指令或转到子程序去执行或从子程序转回。

  如 BR TO F IF (某条件)时,程序的执行转向F地址的指令。

  (四)CLIP-3阵列实现平行处理的实例如下图所示。它表示有象素输出,D为“1”;细点表示无图像输出,D为“0”。每幅图的下半部表示原始图像,上半部表示经过一次处理后的结果。下图(a)表示原始图像,下图(b)-(f)上半部表示在CLIP-3的处理程序作用下,对应各指令处理输出的中间结果和最后结果。处理的目的是要将原始图像中有中间核心的图像圈出来。

图 11-5-3 CLIP-3阵列平行处理实例

  对上述处理程序说明如下:

  指令1是存入指令,它说明输入图像存放在 ,其处理结果送到 ,C表示 清除。

  指令2是处理指令,它说明阈值取0,并且每个象素接受六近邻的信号 又因为有边缘符号E,所以在边缘都有输入。指令中 表示只有“0”象素接受P信号后才能输出N信号。 而PA表示只有“1”象素接受P信号后才能作为处理后的图像输出,并存于 中。因而,经过这样的程序处理,这两条指令就将轮廓勾了出来,如上图(b)上半部所示。

  指令3是同时考虑输入图像及存于 中的轮廓图像。执行指令4时,对 中都具有图像才能送出N信号, 说明没有接受到P信号的 图像才能输入,并再存到 中。经过这样的处理就只剩下二个粗点,如上图(c)上半部所示。

  同理,指令5、6只是把这两点再扩大范围, 有这两点才能输出P信号。所以用PA,并且只有P和A同时存在以及P和A同时存在时,才能输出图像,并存入 中,如上图(d)上半部所示。

  指令7、8说明 有图像,同时 中没有图像时,合在一起才能有P信号,该P信号再和 原始图像一起才能输出处理后图像,如上图(e)上半部所示。

  最后经指令9、10,把这图像和原始图像合起来考虑,就达到处理的目的,将中间有核心部分的图像圈了出来,如上图(f)上半部所示。

  综上所述,平行处理技术的处理速度很快,已得到很多国家的重视。目前英国已从CLIP-3发展到CLIP-4,它有 个处理单元(PE),每8个单元制成一块大规模集成电路,每个象素的处理速度为1ns。

  四、微处理机阵列

  近年来随着微处理机的迅速发展,特别是性能/价格比的不断提高,用微处理机阵列进行图像处理和识别也引起日益重视。目前考虑的一种方案是用微处理机阵列进行并行图像处理、提取特征,而用通用计算机进行分类判决、系统管理和人──机交互作用。整个系统的控制流程它由任务管理处理机、控制单元一个并行处理机(微处理机阵列)、一个顺序处理机的一个分级的存贮器结构等五部分组成。其中前二部分是软件系统,在通用计算机中执行。

  任务管理处理机是一组软件系统,它的作用是将任务分配给平行处理机和顺序处理机,它包括功能管理程序、工作控制程序、输入/输出程序和语言编译程序。

  控制单元由两组软件组成:一组控制并行处理机;另一组控制顺序处理机。控制并行处理的程序有两个软件操作系统,其中一个使并行处理机作SIMD模(单指令流多数据流模)工作,另一个作MIMD模(多指令流多数据流模)工作。确定哪种工作方式是由用户提出的。局部任务用SIMD执行,即对图像各象素同时同步地执行,如计算直方整体任务用MIMD执行,即对图像的某一部分进行操作,另一部分进行另一种操作。

  顺序处理机是一个微程序控制的处理机,它采用位片式双极型半导体处理器,处理速度较高。

  分级存贮器结构是顺序处理机用的。它由两级存贮器组成,一级是双极型存贮器作为工作存贮器和缓冲存贮器,一级是磁盘存贮器。要处理的图像数据从磁盘通过缓冲存贮器,送入双极型存贮。处理器是从双极型存贮器快速存取数据,而磁盘将下一批数据送入缓冲存贮器作准备。这样就较好地解决了从磁盘快速读取数据的问题。