三、自动语音识别（ASR）技术

在多媒体技术蓬勃发展的今天，在信息服务中，自动化语音识别更加受到重视。一旦自动化语音识别获得解决，人机间的真正友好界面将会出现，人机工程也将赋予更新的内容。最近，自动化语音识别技术取得了重大的进展。多媒体应用的热点集中在视频、图形、面向对象的界面与声音、手写输入、触摸屏幕、扫描以及鼠标等技术的结合上。在这些技术中，绝大多数是基于人的视觉功能来建立人机界面的，而对于人类最自然的通讯手段——语音却很少谈及。

过去的语音系统只能识别隔裂开的单词，想让计算机能听明白语音，就必须用静音（停顿）把说的话分裂开来。此外，多数系统要求讲话者进行训练，使它能听懂他的个人发音，这是推广应用的限制。这种限制在当前为个

人计算机所提供的语音识别产品中依然存在。可支持 1～4 人使用，在词汇量方面限制在一定数量，或限于某些专用词汇。这种方式的系统有 Kurzweil、Dragon System 以及 IBM 的产品。这种系统是无法满足公众需求的。

开发广泛适用的语音识别系统，必须是与讲话者无关的系统，而且它还能理解以自然方式对话时的连续语言。现在有两种方法可解决这一使系统不依赖讲话者的问题。