语音合成技术
让机器能模拟人讲话比让机器听懂人说的话要容易得多。目前,机器讲话的本领,已经比它“听”和“理解”的本领领先了一步。
这里所说的能讲话的机器,并不是指像录音机那类机器,而是具有微电脑的语音合成装置。
我们知道,人类发音有清音和浊音,用电子技术中的宽带白噪声信号源和脉冲信号源可分别模拟清音和浊音,用数字滤波器来模拟声道的作用。白噪声信号源、脉冲信号源发出的电信号,经数字滤波器、数模转换器把数字信号变换成模拟信号,然后再经低频放大,就能推动扬声器出发音来。这就是用电子技术模拟人类发音的语音合成技术。
合语音合成装置模拟人类语言有两种方法。
第一种方法叫做“波形译码法”,是一种模仿人讲话声效果最好的方法。它是先分析讲话者的真实语言,把有关的参数测定出来并存储到微电脑中, 然后按这些参数控制脉冲信号源、白噪声信号源和数字滤波器,这样合成出
来的声音可以达到以假乱真的地步。
第二种方法叫做“音素合成法”。人类语言可由 30—50 个音素合成,具体数目与语种有关。
先把基本音素存储起来,按顺序排列,再配以音调发生器和滤波器,然后利用微电脑进行控制,合成出所需要的语音。这样,只要存储有限个音素, 就能产生无限的语音。这样,只要存储有限个音素,就能产生无限的语音。这种方法比第一方法简单多了。但这种方法合成的语言是“机器味”十足的, 为了使合成语言更接近人类语言,让音素通过人的声道的数字模型——一根能改变横截面积的管道,这样,就能合成出更维妙维肖的人类语言来。
由此可见,语音合成技术离不开大规模集成电路的存储器和微电脑。语音技术是把语言参数以数字形式存储的,与录音机、唱片等模拟存储方式相比具有以下优点:第一,由于采用数字存储方式,因而可以迅速地、准确地再现声音。第二,由于采用大规模语音集成电路,克服了传统的录放音装置所需的繁琐复杂的机械装置,因而在缩小体积、减轻重量及加强可靠性上均有大幅度的提高。
目前,语音合成技术已以航空上获得了广泛的应用。随着飞机性能不断提高,飞机仪表日趋复杂,造成驾驶员很大的负担。为了减轻驾驶员的负担, 提高驾驶员处理紧急事态的能力,在最新型的喷气客机的驾驶室里,都安装声音报警装置,即通过一套声音合成装置,把“失速”、“机械系统故障” 等警报用声音直接通知飞机驾驶员。语音合成技术的应用已扩展到各个领域,涌现出了很多会说话的生产、生活用品,大大地方便了使用者。会说话的手表除了报时外,还能用正确而清晰的声音,提醒人们有关时间和约会的事项。会说话的汽车能向司机和乘客发出各种提示和警告,并向司机报告汽车各种数据和运转情况。会说话的打字机能将打满的一页文稿朗读一遍,以便让打字员校对所打的内容有无错误。
会说话的词典、会说话的家用电器、会说话的自动售货机等等,这一切都无不令人耳目一新。
最近,日本京都 ATR 电话翻译实验室研制出一部电话翻译机,用户在打国际长途电话时,它可以把发话人的语言翻译成受话人所能听懂的另一种语音。这是当今的语音识别技术、语音合成技术与自动翻译技术的完美结合。随着大规模语言集成电路的容量提高、价格降低,语音处理技术将会在
更广泛的领域里获得应用。到那时,各行各业都会有话语优美动听的“服务员”为你效劳。
