图象识别

我们知道,人类是通过感觉器官从外界获得信息的。比如耳的听觉、鼻的嗅觉、眼的视觉等等。大量的统计表明,人类凭眼睛获得的图像信息占人类感觉器官获得信息总量的 90%以上。人眼和大脑的结合对视觉图像信息具有很高的鉴别能力。婴儿稍稍长大一点后,他或她一眼就能认出自己的母亲, 并迅速作出反应,尽管母亲的服饰、容貌、面部表情以及背景、光线明晃程度常常都在变化。这的确是一个十分快速而复杂的图像信息的接收、识别过程。现在,计算机也可以具有一定的图像识别能力。

图像识别也称为模式识别,它是利用计算机实现或部分实现人脑对视觉

信息(包括图像、景物、文字等)的识别。计算机配上图像输入和输出设备构成图像识别系统。

通过摄像机的扫描系统把二维平面图像转变成一维时间信息,再经过高速模/数转换器输入计算机。这样,计算机就可接收到图像信息。将输入的图像信息进行分析,再同计算机内所存储的图像信息进行比较,从而作出识别判断。

文字识别的方法也是同样的。就是说,如果要计算机能识别出字母 A, 就必须先将 A 的点阵信息存储在计算机内存中,使其能够和输入的文字图形进行比较。如果二者完全相同,即可判断出来。但是,对于手写体的字,即使同样是字母 A,每个人的书写都会有所变化,如果要让计算机仍能正确识别,就需要将 A 的各种书写形状信息存储到计算机内,这需要巨大规模的存储器。也可以由计算机先对输入的文字图形进行分析,将其特征信息(笔画的长度、角度和位置,以及笔画的分布和背景的性质)提取出来,然后再与识别字典中标准文字的行征信息比较,找出最接近的文字。这种识别方法叫做特征匹配法。对于汉字来说,由于字种多、字形复杂,所需的识别时间长。要使这种识别方法实用化,得在加速识别过程方面下功夫。另一种快速识别的方案是:向识别系统输人同一字符的 3000 种不同形状的书写体字样,并由某一软件抽取出众多字样的共同特性,此后仅输出与此共同特性相符的信息。

图像识别中处理的信息量很大,要求计算机的运算速度高、存储容量大才能进行图像的即时识别,目前,普通的计算机还不能满足这种要求。如果能找到这样的识别方法,不是把物体的图像作为点的集合体,而是象人那样, 能够抓住本身面貌的特征进行识别,那么,计算机便能向人工智能型更靠近一步。如果研制成功光计算机,则这一步就可以达到。由于光计算机是以光信号进行信息处理,能够把物体的原形进行图像处理,也就没必要把文字和图形再一个个分解存储。而且,光计算机处理信息的速度比电子计算机的速度高出数千倍。因此,光计算机可望在图像处理方面发挥巨大的威力。

近年来,图像识别这门新技术已取得了很大的进展。能识别汉字的电子阅读器已经问世。日本九州工业大学研制出的认读装置每秒可读 A4 资料1000 页,约 100 万字,而且对印刷体字的认读准确率达 100%。最近,日本电气公司研制出一种人物脸面识别装置,它可存储 3500 人的头像,瞬时即可识别出所需的特定人物脸面,1 秒内可识别 3500 人。

图像识别已经在许多领域获得应用。在医学上,利用图像识别方法作心电图、脑电图的波形分析、从显微照片上进行细胞的自动分类计数、染色体的分类以及癌细胞的识别。此外图像识别还用于邮局的信函自动分拣,银行的自动点钞,卫星遥感图像的分析处理,以及公安部门的笔迹、指纹特征的鉴别等等,通过对口型变化的图像分析可以进行语音识别,而且可以大大提高识别的正确率。

计算机对图形和手写体的识别,将引起一个计算机输入方式的重大突破,用手写输入可以使计算机更加小型化和使用更加方便。日本索尼公司已研制出无键盘微电脑,这种新型电脑比普通袖珍计算机更为轻便小巧,用一支电笔直接在它的 4×6 英寸的液晶显示屏上书写字句,就可以进行各种操作,即使对计算机知之甚少的人也同样可以使用。人们估计这种计算机也许会成为一支异军突起的个人电脑的主力军。

计算机除进行图像识别外,还可以进行图像的各种处理。当图像亮度偏暗或偏亮时,可以通过计算机把图像的亮度进行适当的变换,使其适合于人眼观察的范围。还可以把模糊不清的图片、文字和失真的图形修整得清晰如初。根据人眼对彩色图像比黑白图像更为敏感的特点,利用图像假彩色增强显示技术,把一幅黑白图像各级灰度分别用彩色显示出来,就能大大提高人眼对图像细微结构的识别能力,从而将黑白图像无法检测出的信息直观地显示出来。

随着高速度、大容量电子计算机的不断发展,图像识别和图像处理技术的功能会越来越强,其应用前景会更为广阔。