三、自动语音识别(ASR)技术

在多媒体技术蓬勃发展的今天,在信息服务中,自动化语音识别更加受到重视。一旦自动化语音识别获得解决,人机间的真正友好界面将会出现, 人机工程也将赋予更新的内容。最近,自动化语音识别技术取得了重大的进展。多媒体应用的热点集中在视频、图形、面向对象的界面与声音、手写输入、触摸屏幕、扫描以及鼠标等技术的结合上。在这些技术中,绝大多数是基于人的视觉功能来建立人机界面的,而对于人类最自然的通讯手段——语音却很少谈及。

过去的语音系统只能识别隔裂开的单词,想让计算机能听明白语音,就必须用静音(停顿)把说的话分裂开来。此外,多数系统要求讲话者进行训练,使它能听懂他的个人发音,这是推广应用的限制。这种限制在当前为个

人计算机所提供的语音识别产品中依然存在。可支持 1~4 人使用,在词汇量方面限制在一定数量,或限于某些专用词汇。这种方式的系统有 Kurzweil、Dragon System 以及 IBM 的产品。这种系统是无法满足公众需求的。

开发广泛适用的语音识别系统,必须是与讲话者无关的系统,而且它还能理解以自然方式对话时的连续语言。现在有两种方法可解决这一使系统不依赖讲话者的问题。