第二章 多媒体信息的计算机表示

一、文字

文字是计算机中的一种最常用的表达方法,多媒体信息也少不了使用文字。西文文字通常用 ASCII 码表示。ASCII 是美国信息交换标准代码(American Standard Code for Infor- mation Exchange)的缩写,是由 7 位二进制编码组成的字符集,包括大小写字母、标点、数字、数字符号及控制字符等共128 个字符。

中文文字目前使用的是 1980 年制定的国家标准 GB2312—80,分二级字库共 6763 个汉字和 850 个符号。采用双字节编码,即两个 ASCII 码大小表示一个汉字。港台地区与海外使用的另一种汉字编码标准是 BG5,它的字符集更大一些,但仍不能满足对古今所有汉字的编码。目前,国际计算机界已开始采用了共同的标准,即 ISO10646,该标准有 2 万多汉字,也可处理日本、韩国等许多国家的文字。

二、音频

音频(Audio)就是声音的信息表示,通常指在 15~2000Hz 的频率范围的声音信号。声音进入计算机的前提是对各种声音进行数字化。这个数字化过程有对声音采样和对声音加以量化两个步骤。采样就是把模拟声音信号变换成数字信号,采样的频率(一定时间内采样的数量)越高,声音“回放” 的质量就会越好,但要求的记录空间也越大。量化就是把采样所得的值用二进制表示,一般可用 8 位、16 位、32 位、64 位二进制数表示(也叫分辨率), 位越多声音的质量越好,但存储空间也成倍增加。下表表示采样的速率、分辨率与存储空间的关系。

采样频率

分辨率(位)

立体声或单声道

1 分钟( Mbyte )

44.1kHz

32

立体声

21

44.1kHz

32

单声道

10.5

44.1kHz

8

立体声

5.2

44.1kHz

8

单声道

2.6

22.05kHz

32

立体声

10.4

22.05kHz

8

单声道

1.3

因此,要获得优秀的音质必然会占用大量的存储空间,所以声音信号需要压缩存储,这将在后面的章节中讨论。

还有一种声音是电子合成的声音,它分为音乐合成和语音合成。音乐合成一般采用 MIDI 标准,语音的合成没有统一标准。

MIDI(Musical Instrument Digital Interface,乐器数字接口)标准是 80 年代初制定的,它描述一段音乐的音符、音调、使用什么乐器等,并通过音乐或声音合成器(Synthesizer)解释播放,产生音乐或语音。MIDI 与数字化声音各有优势,数字化声音比较自然,但会占用大量的存储空间,同样播放时间长度的 MIDI 音乐要比数字化音乐的存储空间小 200~1000 倍。MIDI 可以比较方便地修改、处理细节,比较适合于音乐创作。

三、图像

图像是多媒体信息的重要组成部分,它再现了人们的视觉。一般静态图像分为两种:位图(Bitmap)和矢量图(Vector—Drawn)。位图适用于逼真、精细的照片式图像,而矢量图则适用于直线、方框、圆圈、多边形以及其它可用角度、座标和距离来进行数量化表示的图形。上述两种图像按不同文件格式存储,并且可以相互转换。

位图:位图一般是用矩阵来表示,单色的图像可用一维矩阵,即 1 位的

位图表示。16 色的图像用二维矩阵,即 4 位的位图表示,256 色的图像用 8 位的位图表示,32768 色的图像用 16 位表示,24 位则可以表示 1670 多万种颜色,即我们常在计算机中说的真彩色。

位图一般可用 Windows 中的画笔一类的程序画出,也可以用程序从屏幕上直接抓取,甚至用扫描仪或数字化设备获取照片、电视、电影图像。比如我们经常在大商场见到的“电脑画像”、“电脑婚纱摄影”等均属后者。

抓取来的图像,可在很多程序中进行编辑,替换颜色、插入文字等。位图编辑软件主要有 Windows 下的画笔,Micin- tosh 机的 HyperCard,Aldus 公司的 Photoshop,或 Hijaak Pro 等。

矢量图:是一种描述性的图像,它存储的是量化后的数字。矢量图的元素有直线、矩形、椭圆形、多边形、正文等。矢量图多用于计算机辅助设计

(CAD)、三维动画等一些电脑创作。

对于一个特定的元素(如一种颜色的正方形),矢量图比位图在存储空间上要省很多,但对于复杂的图形,矢量图要用许许多多的元素来描述,并且要将他们还原到屏幕上,就会占用很多的系统资源和时间,位图的刷新速度则相对要快一些。矢量图与位图之间可以进行转换。

不论用哪种表示方法,图像都要按一定的格式存储在软盘或硬盘上。Windows 平台下最通用的图像格式有以下几种:

文件扩展名 图像格式

BMP BitMap

DIB Microsoft Windows DIB

PAL Microsoft Palette

DRW Micrografx Designer/Ddraw

GIF CompuServe GIF

JPG JPEG

PCX PC Paintbrush

PIC Lotus1-2-3Graphics

TGA Truevision TGA(Targa)

TIF Tiff

WMF Windows Metafile

四、动画

人在观察过物体时,物体的影像会在视网膜上保留一段的时间。当人们看到一系列每次改变很小交替速度很快的图像,就会有物体是连续运动的感觉,动画就是利用这种原理制作出来的。

计算机动画研究始于 60 年代初,1963 年 BELL 实验室制作了第一部计算

机动画片。当时主要致力于研制二维动画。70 年代初期开始研究三维计算机动画,直至 80 年代中后期才进入实用阶段。随着具有实时处理能力的超级图形工作站的出现,以及三维造型技术、真实感图形生成技术的迅速发展,开发出了一些实用化、商品化的三维动画系统。到 90 年代初,计算机动画技术成功地应用于电影特技,取得了轰动性的效果。如电影《终结者Ⅱ》、《侏罗纪公园》等影片,均采用计算机动画制作了大量现实生活中没有或用传统技术无法获得的镜头,与真人表演天衣无缝,给人耳目一新的感觉,前者获奥斯卡最佳电影特技奖,后者成为 90 年代世界最卖座片,标房收入高达数亿美元,由此可见计算机动画技术的重要作用。

五、视频(Video)

视频是多媒体技术的重要组成部分。全世界广播视频标准有 NTSC、PAL、SECAM 三种。

NTSC 制式:由美国国家电视系统委员会(National Tele- vision Systems Committee)于 1953 年制定的一种兼容的彩色电视制式,美国、日本等国家

广为使用。这一制式又称为正交平衡调幅制。每一帧视频由 525 行水平扫描

线构成,分辨率为 525 行水平扫描线。传输速率为每秒 30 帧,每帧由两次扫描完成,每一次扫描画出一个场 1/60 秒,两个场构成一帧。由两个场构成一帧的过程称为隔行扫描,可以防止荧光屏的闪烁。

PAL 制式:是原西德 1962 年制定的一种兼容的彩色电视制式。PAL(Phase Alternate Line)是指“相位逐行交变”。我国和大部分西欧国家使用这种制式。它是把彩色加到黑白电视中去的一种集成方法。水平扫描 625 行、每秒 25 帧、隔行扫描、每场需要 1/50 秒。

SECAM 制式:法国及俄罗斯等东欧国家使用的彩色电视制式。SECAM

(Sequential Color and Memory)也是 625 行,50Hz,但其基本技术及广播的方法与 NTSC 和 PAL 有很大区别。

除以上广为使用的广播视频标准以外,目前许多国家和厂商正致力于开发新的视频技术。

  1. 高清晰度电视 HDTV(High definition Television)

国际学术界也使用 ATV、HRV 等其它简称。国际无线电咨询委员会 CCIR 将高清晰度电视定义为:当观看距离为屏幕高度的三倍时,系统显示效果等于或接近于一名正常视力者在观看原视景物或演示时的临场印象的一种新型电视系统。通俗地说,HDTV 就是画面高度清晰、音响高度逼真的电视。与传统电视相比,主要有四大特点:

  1. 高清晰度画面。电视画面的清晰度主要取决于单位时间内所接收到的横向扫描线的条数。普通彩电的扫描线是每秒 525/625 条,而 HDTV 的横向扫描线则高达 1125/1250 条,因此,HDTV 能提供相当于普通彩电 4 倍~5 倍的高清晰度画质。

  2. 新的电视显示手段。传统的彩色电视的阴极管显示 CRT 技术带有明显的局限性,无法用来制作 76.2 厘米以上的超大屏幕彩电。

  3. 近于人类自然视域的画面结构。HDTV 的画面纵横比由现在普通彩电的 3∶4(近似于正方形)变为 9∶16(长方形),这种长方形屏幕与现代电影院的电影屏幕非常相近,避免了现代宽银幕影片转为电视片播出时的画面损失。

  4. HDTV 采用数字高频广播(DAB)技术作为电视音响传播手段,突破了原有电视传音的模拟声道限制,使收听、收看效果大大提高。

  1. 视频会议系统(Video Conferencing System)

视频会议系统是多媒体网络的重要应用,不同地点的人员,可以通过显示器或电视屏幕来传达文件、进行讨论、协调工作、共享信息等。人们无需关心地理位置上的差异,只需把自己的方案、档案资料准备好,就可以随时交与“与会”各方,“面对面”地讨论问题。