第八章 多媒体信息检索服务

一、多媒体信息检索服务及其构成

多媒体与超媒体信息检索系统是一种人机交互系统,也是多媒体通信系统中一个十分重要的分支。由于多媒体通信系统是一个全新的课题,因而出现了一批新的术语。为便于正确了解这些术语的含义,现将其中最主要的术语解释如下:

·超媒体(Hypermedia)——通过外部树形的链(Hy- perlink)将多种类型的媒体连成一个集合,这个集合称超媒体。

·脚本(Script)——描述一个显示或输入对象中各对象间关系(包括相关对象间的时空关系、同步)的技术规范。

·脚本软件(Scriptware)——实现脚本的软件。

多媒体信息检索服务的系统结构

  1. 信息提供者。信息提供者是多媒体信息检索服务的重要组成部分。它是多媒体和超媒体检索系统中的全部信息的产生者。是它们将多媒体信息产生出来,并以一定规则传送出去。

信息提供者的三个最基本的要求是:①有编辑多媒体与超媒体信息的能力;②可向数据库上载它产生的多媒体和超媒体信息,并有能力修改数据库;

③可向下加载检索途径(Trace)。

  1. 信息库。多媒体信息检索服务系统中,全部信息是存放在信息库中的。由于多媒体与超媒体信息的特殊性,其库结构也将是特殊的,特别是需要从硬盘中大量读取信息的场合。因而,需要特殊算法来满足需要。

信息库的三个基本要求是:①可存储多媒体与超媒体信息;②能通过交互检索已存储的 M&H 信息;③能接收信息提供者的上载数据。

  1. 信息系统管理者。多媒体信息检索服务系统是个很复杂的系统,它不是一个简单的点对点通信,因而在系统中将有一个信息管理者存在。

信息管理者的最基本要求是:①管理多媒体和超媒体信息;②管理多媒体和超媒体信息目录;③管理系统用户;④向上装载已处理的检索过程;⑤ 向下装载未处理的检索过程;⑥计费;⑦接入控制;⑧保护;⑨系统监测。

  1. 信息系统用户。多媒体和超媒体信息检索系统的用户是系统信息的实际消费者,它受信息管理者管理并接入系统,通过多种途径来检索所需信息。

信息消费者的最基本要求是:①查阅多媒体和超媒体信息目录,查看系统的有效信息;②根据有效的信息目录来检索多媒体与超媒体信息;③下载和修改多媒体与超媒体信息;④多媒体与超媒体信息的远程查询;⑤上载未处理的检索过程。

多媒体信息检索服务的网络拓扑结构

多媒体信息检索服务可有三种典型的网络拓扑结构。

  1. 点对点。这是一种常用的拓扑结构,用户终端与数据库是点对点连接。引伸开去,在这种结构中也包含多个用户对一个数据库主机的量形连接。由于在这种网络拓扑结构中,一个用户只能查一个数据库,因而这种拓扑结构适用于专网信息系统。

  2. 一点对多点。在这种拓扑结构中,一个用户可接续多个数据库主机, 因而也可查找多个数据库的信息资源,这是一种适用于公共网信息系统的网

络拓扑结构。在这种拓扑结构中,有一点要强调指出的,这里对不同数据库的路由选择是由终端来实现的(或由终端用户来实现),因而系统中数据库的增减需及时通知全部用户,否则将产生系统对多点的网络拓扑结构差错。

  1. 一点对多点(通过接入点设备)。在这种网络拓扑结构中,一个用户可接续多个数据库主机,因而也可查找多个数据库的信息资源,这也是一种适用于公共网信息系统的网络拓扑结构。与上一种不同之处是,它增加了一个接入点设备(AP),因而从性能上就大大优于前一种方式了。由于在网络中增加了接入点设备,它将负责对系统中数据库的管理,这样对不同数据库的路由选择已不是用户终端(或用户)的事,而是由接入点设备来自动完成。系统中数据库的增减只需在接入点处登记,而无须通知所有用户;另外, 接入点设备还实现对用户终端的控制和管理。因而与上一个网络拓扑结构相比,这一种结构更为实用。

多媒体信息检索服务系统处理的信息

  1. 内容数据信息。内容数据信息是用单一媒体的编码标准来表示的信息。它包括文本、二维和三维图形、静止图像、二值图像、声音和活动图像。

  2. 多媒体和超媒体信息。多媒体和超媒体对象可用它们在实时交换环境下的适当标准来进行表示和编码,它用到单媒体的一些表示标准。多媒体和超媒体表示信息的标准,至少必须拥有下列特点:①在表示对象之间可有不同的时间同步算法;②具有表示对象间的空间复合的能力和机制;③可以用 Hyperlink 去引用外部的表示信息;④可以定义用户的不同输入请求;⑤ 定义对象间的链接,例如事件(Event)和作用(Action)的链接;⑥描述与对象相联系的题目信息,详细说明它是如何在用户面前显现的;⑦提供一种可引用内容或将这些内容包含在 MH 对象之中的机制。

  3. 脚本信息。脚本信息将选用一些合用的标准来编码和表示。它将用单媒体信息的编码标准和 MH 信息的编码标准。脚本信息是一组特定的用语义关系联系起来的结构化的 MHI(多媒体和超媒体信息)。它需要提供这一组多媒体信息的运作过程及与外部处理模块间的关系。

脚本信息至少需具备如下特点:①能控制对结构的操作;②宣布全局控制事件;③复杂的定时操作;④MHI 对象的表示;⑤外部处理机的调用;⑥ 库函数的调用;⑦定义校核点及从校核点的恢复功能。

  1. 特定的应用信息。上面所述的信息是三类低层的信息,可以由标准来定义和表示。第四类信息是高层信息,它是与应用密切相关的,它将随应用场合的不同而有很大的不同。它不像前三类信息那样有一般性的表示方法,它的表示方法是基于上三类的基础之上的。

一个重要的例子是,最终用户工作站执行了 Scriptware 后,产生的返回踪迹(Trace)是随着不同的应用场合而不同的。另一个常用的典型例子是目录(号码簿)信息,通过目录信息可检索到所需的多媒体或超媒体信息,因而目录信息是按照信息类型的不同(如:文档、对象、文件、文本、数据包等)来分类的,并用内在关系互相联系起来。这样,用户就可以在检索所需信息前,先利用目录信息来找到所需信息位置。目录信息就是典型的特定应用信息。

二、多媒体信息检索服务标准及信息交换

  1. 多媒体信息检索服务的国际标准和工业标准

国际电联 CCITT 和国际标准化组织 ISO 在多媒体信息检索服务领域已经进行了大量的标准化工作,现在已有一批建议可供使用。另外,在多媒体的开发中,一些工业发达国家为本身设备的开发也制定了一些工业标准。鉴于这些标准已经广泛使用,因而很可能在今后的国际标准化中被采用。所以, 在多媒体和超媒体信息检索服务系统的研究中,国际标准和工业标准都是值得重视的。下面将围绕多媒体信息检索服务的国际标准和工业标准进行讨论。

  1. 单媒体内容数据信息

①文本

文本含有三方面内容:符号、符号的字型和字体、在数据传送和操作管理中的符号编码。已有的国际标准有:ISO646;CCITTT.51、T.52、T.61、T.101。目前还有一个新的国际标准正在制定之中,这就是 ISO10646,它基本上是一个 16bit 编码结构。该国际标准将把世界上所有的编码表都纳入统一的编码结构之中。

在已有文本的工业标准中,最著名的是 ASCII 码,这是美国的国家标准, 另外还有 CDA 和 RTF 等。

②图形

图形编码一般有如下几种方法:①镶嵌图形法;②动态再定义图形;③ 几何图形法;④增量。关于图形编码的国际标准有:CCITTT.101 建议(可视图文的表示层句法,定义了全部图形编码方法);CCITTT.105 建议(关于增量编码的建议);ISODP8632(CGM);ISO7942(GKS);ISO9637(CGI)。工业标准有:WMF;DXF;PICT;PostScript。

③二值图像与静止图像

静止图像是与时间无关的相片图像,是颜色、色饱和度、强度连续变化的二维相片。

其国际标准有:CCITTT.4、T.6;CCITTT.81;CCITT- T.82;ISODIS11544; ISODIS10918.

工业标准有:GIF;PCX;DIB;TIFF;IFF;JPG。

④声音

语音编码技术国际标准绝大部分都是 CCITT 提出的。Rec.G.711 描述了8kHz 抽样、8bit 量化的语音编码;Rec.G.721 描述了低速率、低质量的语音编码;G.722 则是高码率、高质量的语音编码。在 MPEG 中也有语音编码,通常被称为 MPEGAudio,它的编码率为 8~32kB/s。MPEG Au- dio 算法也用于数字式盒式录音机和数字式语言广播,它采用的是子带编码压缩技术,因而能获得低的码速和高的语音质量。另外还有 T.101 的 AnuexE.ODA 将声音引入了文件体系结构中去。在工业界大多数采用 PCM 和 ADPCM 技术。

⑤运动图像

运动图像指的是人们所能见到的活动图像(如电视、电影、录像等)。在运动图像方面的国际标准最主要的是:CCIT- TH.261;ISO11172(MPEG)。它们均是基于 DCT 变换的压缩编码技术。H.261 是用于点对点实时通信的场合,在可视电话和会议电视场合都采用 H.261. 其数据速率为 P* 64kbit/s.MPEG 是用于存储读出系统(如信息检索系统、录像机、数字电视等),而不是用于实时点对点通信,其原因是 MPEG 算法将引入固有时延。MPEG1 是家用录象机质量级的压缩运动图像编码,其最高码速为 1.5Mbit/s,这个

速度与光盘(CDROM)的读出速度是相适配的(150KB/s)。MPEG2 是高质量的运动图像编码(如 HDTV),最高编码速率为 40Mbit/s。MPEG 还正在致力于研究低速率的运动图像编码(希望能达 10kbit/s)。除上述两种主要的国际标准外,在其他场合还可用 JPEG。虽然说 JPEG 是专门为静止图像编码而研究的,但也可用于运动图像编码。

工业标准有:CD1;DVI,DVI 使用了两种编码格式:RTV、PLV;Macromind 和 Animotor 是动画的工业标准。

  1. 多媒体和超媒体信息

近年来,开始对多媒体和超媒体对象的表示和编码进行标准化。对多媒体和超媒体对象的表示和编码涉及到以下内容:

·对单媒体数据或多媒体对象的引用和嵌入。

·时间同步和空间同步。

·项目信息(Projector):项目信息指的是与内容有关的显示属性信息。譬如对声音内容的信息来说,它的项目信息指的是音量、声道等属性信息。

·演奏方式(Rendition)信息:演奏方式信息指的是一类与媒体直接相关的信息。譬如对时基(Timebase)媒体来说,可以有“速率设置”的 Rendition信息;对可见(Visible)媒体来说,可以有“尺寸选择和设置”的 Rendition 信息。

·将单媒体(Content)信息聚焦和复合起来,构成多媒体对象的方法。

·多媒体对象间的超级链(对象间用链接关系链起来)。

·输入信息(客户与系统的交互)等。

目前,多媒体和超媒体对象的表示和编码已有多种,最具代表性的是MHEG;HyTime;Hyper ODA;MPEG 等。

①MHEG

MHEG 是 ISO/IECJTCI/SC29/WG12 和 CCITTSG8/

Q11 组成的联合工作组的研究成果。该标准是用于实时交换的多媒体和超媒体信息对象的表示法。

②HyTime

HyTime 是 ISO/IECJTC1/SC18/WG8 的工作成果。Hy- Time 主要研究的有: 多媒体同步的表示,超媒体在文档内或文档间的链接。HyTime 适用于综合的开放型多媒体和超媒体信息系统,以及在开放环境下的文档交换和操作管理。

HyTime 标准的最近版本是 1992 年版,标准号是 DIS- ISO10744。HyTime 与 MHEG 在很多方面是一致的,但它们的使用方法和应用环境是不同的。涉及到文档的处理和交换可用 HyTime,涉及到对象的处理与交换则是用 MHEG。Hy- Time 从标准的设计角度出发,试图用于枢纽间的信息交换,而不是专门用于实时信息交换。

③HyperODA 与 ODA

HyperODA 与 ODA 是 ISO/IECJTC1/SC18/WG3 和 CCITTSG8/Q27 的成果。HyperODA 与 ODA 主要是用于文档的交换与操作管理。HyperODA 是一种围绕的体系结构(外部元素必须根据 ODA 标准化),仅限于 ODA 环境下的文档交换。ODA,即开放文件体系结构,是用于交换文件的描述方法。ODA 不支持多媒体信息的处理与交换,但可以在 ODA 的内容(Content)中引用其他方式编码的多媒体信息。Hyper- ODA 是基于 ODA 的,但能处理和表示多媒体和超媒体信

息。

④其他标准

包括 MPEG 和 MPEG1(ISO11172)。MPEG1 定义了在 MPEG 中交织的数据码流(图像、语音和文本)的帧结构,这是一种表示时间同步特性的信息表示法。当然,这种表示法本质上是线性的,只适用于表示比较简单的信息,主要用于表示运动图像及与其相关联的声音数据。在 MPEG 的帧结构中,还保留了若干比特供文本交互用。

⑤工业标准

  • RIFF:是包在其他格式文件外的一种包封结构,在 RIFF 的标记上,标有分量的类别和尺寸。这些被 RIFF 包起来的分量,则是用独立有效的常用的文件格式来表示。

  • MCI:提供一种高层的命令接口(API),用于多媒体系统的源文件中, 它使用的编码格式为 RIFF。

·Quicktime:用来描述并行的媒体数据流和它们之间的同步。Quicktime 是将多媒体与格式化的 Movie 环境相联系的描述方法。还有专门用于 PC 的Hypertext、Hypermedia 等格式,但都是专用的,无交换能力。

  1. 脚本层

这由ISO/IECJTC1/SC18CCITTSG1/Q17 和ISO/ IECJTC1/SC29CCITTSG8/Q9

研究,至今尚无国际标准。

工业标准有:HyperCard、Toolbook 和 Scriptx。它们都使用了能够表示超级结构(Hyperstructure)的通用编程语言作为通用的 Script 语言。

信息交换

从显示的观点,信息交换(Information Interchange)可分为两大类: 一类为实时信息交换,另一类为非实时信息交换。

  1. 实时信息交换

实时信息交换指的是边传输边进行显示的一种信息交换方式。实时信息交换的国际标准有:CCITTT.170 建议;CCITTT.175 建议;CCITTT.176 建议; CCITTT.41X 建议;CCITTT.43X 建议。

在 T.170 建议中,描述 AVI 中的某些业务需要,并定义了“Ⅰ”、“Ⅱ”、“Ⅲ”、“A”和“B”五种接口。

  1. 建议描述“Ⅰ”接口(从信息消费者到主机),它包括文件传送、选择、浏览、远程执行等。

  2. 建议描述“B”接口,这是一个实时信息交换的协议,它覆盖了 MHI 的 RTI。

协议“A”为应用层协议,目前已有 ContentData 的 RTI 的“A”协议。这些协议有:T.102、T.103、T.105、T.43x 和 T.41x。

一个重要的工业标准是 X.11.X.11 是本地(局域)网络客户/服务器

(Client/Server)协议,用于图形和窗口信息。

  1. 非实时信息交换

非实时信息交换指的是,终端必须等到一个单元的信息(文件或数据库记录)完全传送完毕后,才能显示的一种信息交换方式。非实时信息交换的标准有:FTAM;RDA;DFR;DTAM.FTAM 从本质上来说,只能操作和传送完整的文件,然而,对其他类文件,它也可操作和传送其中的一个对象,并且还能对文件的存储执行某些管理功能。RDA 提供从数据库中将其中一项(如,

一条记录)传送出去。这个标准分为多个部分:首先,它定义了通用的服务和协议;其次,分别为不同的数据库体系结构和数据库操作管理作了专门的定义。目前,只有一个专门定义已完成,这就是 SQL 数据库语言。当然,今后还将发展另外的数据库语言和组织。特别是存储对象结构的文本数据库将会用 SGML 来描述。

DFR 很像 FTAM 和 RDA,但只能用于文档操作。文档由其属性来描述,属性的用法与 ODA 相近。DTAM 是用于存取和操作管理 ODA 文档的。

三、多媒体信息检索服务硬件技术1.终端设备

用于多媒体信息检索服务的终端,既可以用通用的计算机,也可以用专用的终端设备。

  1. 总线。

在多媒体设备中,除中央处理器(CPU)外,还需辅助以特殊处理器,这些处理器通过总线和附加的控制器将内存储器和外部设备连接起来。由于总线速度受限而制约了设备的性能,目前解决的办法是采用局部总线。

大多数个人计算机和工作站都提供扩展槽,扩展卡可插入这些槽中与系统总线相连接。由于不同的计算机平台有不同的总线系统,因而一般来说, 扩展卡不具有通用性。

  1. 本地存储。

本地存储指的是计算机或工作站的本机存储,一般有四类:工作存储器

(RAM)、外部永久性存储器(硬盘)、备份存储器(磁带)、可移动式存储器(软盘、CDROM、可拆卸式硬盘)。

对存储器的要求为:存取时间/寻道时间;读写时间;存储容量;可移动性;可写性:存取/编码和文件结构;模拟存储。

  1. 多媒体的显现。

多媒体的显示输出与用户的感官要求密不可分。因此,在研究多媒体的显现硬件设备时,首先需研究一下,用户感觉对不同媒体的显现要求和限制。

首先讨论视觉的限制,根据实验可知,人的视觉分辨率为 1/120 度,这相应于在一个人的正常视距内,屏幕上分辨力 380dpi(点数/英寸)。从目前或将来可及的技术来看,视频显示器只能达到上述分辨率的 1/10。人眼对亮度的辨别率为 240~300 级灰度,而且人眼对不同颜色的分辨率是不相同的。目前采用的 24bit 量化(红、绿、蓝各 8bit,分别有 256 种灰度)是与人眼适配的。在大多数场合下,色彩比分辨率更重要。

再来讨论人耳的听觉。正常人的耳朵可以分辨出 80db 强度的变化(16bit 可以表示 96db 的动态范围)。人耳的感知频率为 20Hz~20kHz。根据纳奎斯特抽样定律,抽样频率必须大于 2 倍的最高频率,因此对音质要求很高的场合(能覆盖人耳感知频率的全程),抽样频率为 44.1kHz,对每个抽样进行16bit 量化。对于立体声来说还分左、右 2 个声道,这样未压缩的数字化立体声的码率为 44.1*4KB/s。在研究了图像和语言的显现问题后,下面来讨论现有多媒体的硬件设备。

①显示器:现有的显示器为:640*480,768*512,800*600,1024*768, 1024*1024,24bit 量化(RGB 各 8bit)。它们在显示卡上各自带的存储器容量为 900、1152、1406、2304 和 3720KB。为了减少存储容量,通常用调色板

法(262114 种选择,共有 1680 百万种颜色)来显现 256 种颜色。也有 RGB 各 5bit 量化,可直接表示 32768 种颜色。

②声音:为了避免混叠,抽样频率应为所需最高频率的 2 倍。语音编码器采用的压缩编码算法通常有:PCM、DPCM、ADPCM 和线性预测编码(LPC) 等。

③目前市场上已有的声音卡:Multi Sound Board;ProAu-dio Spectrum; Mpc Audio One;Sound Blaster Pro。

④静止图像的硬件有:JPEG Board;i750;Kodak PhotoCD。

⑤视频卡有:C Cude;CD1;DVI;JPEG Decoders。

  1. 目前与多媒体接口的软件平台有 Microsoft Win-dows、Macintosh

    System、Xwindow System。

网络环境

  1. FDDI

FDDI 是以令牌协议为基础的高速局域网,其速度为 100Mbit/s。

  1. MAN(MetropolitanAreaNetwork)

MAN 网是用于填充局域网和公用广域网之间的空白,这类网络的 IEEE 标准是 DQDB。

  1. ISDN

ISDN 是一种广域网,它提供两种接入类型:基本接入速率为 2B+D;一次群接入速率为 30B+D 。另外还有: HO 信道( 384kbit/s ); H11 信道

(1536kbit/s);H12 信道(1920kbit/ s)。

  1. BISDN

BISDN 即宽带 ISDN,它采用的是 ATM 规程,速率可达 155Mbit/s。

  1. 其他

其他网还有 PSTN、DBN(DigitalBroadcastingNetwork)等。

主机

多媒体信息检索服务对主机的要求很高,最主要有如下三方面:向多用户传送大量的实时数据;主机有很大的存储容量;有相应强的计算能力。

这里值得一提的是主机的硬盘速度,因为在多媒体信息检索服务中硬盘的存取速度往往是系统的瓶颈,它需要与通信网的通信速率相匹配。在目前, 如工作在一次群 NISDN 环境下(30B+D1920kbit/s),与目前硬盘的存取速率

(8Mbit/s)是基本适配的,不至于成为瓶颈。当通信环境进入 BISDN,通信速率将达 155Mbit/s,那么硬盘的存取速率在 200Mbit/s 以上才能适配。有幸的是,据预测,硬盘在 10 年内可望达到这个存取速率。

四、多媒体可视图文系统

多媒体可视图文系统是一种远程多媒体信息检索系统,它通过公用分组交换网、局域网和数字数据网将分布在不同地域的多媒体信息源组织起来, 通过电话网、综合业务数字网和用户专线向广大用户提供多媒体信息服务。它是一种公用的开放型的信息服务系统。多媒体可视图文系统是现在业已进行商业运行的可视图文业务网的升级系统,它对现有系统是向下兼容的。它是 90 年代初国际上刚完成标准化的最新一代的多媒体远程信息检索系统。

多媒体可视图文系统由用户终端设备、多媒体可视图文接入点设备、多媒体信息数据库和业务管理中心四大部分组成,为了与其他网相连构成广域

的高速信息环境,从而获得更多的信息,网内还有三类设备:专用集线器

(HUB)与 ATM 相连、路由器与其他局域网相连、网关与因特网相连。

用户终端是用户与系统的接口,用户是通过用户终端接入到系统中去, 并通过用户终端获取多媒体信息。多媒体可视图文系统中用户终端有三种: 一种是电话网上的用户终端,用户终端通过电话网与系统相连,其通信速率为 14.4kB/s;第二种是综合业务数字网上的用户终端,它通过电话线与综合业务数字网的交换机相连,其通信速率为 128kB/s;第三种是专线接入终端, 它通过专线直接和系统相连,其通信速率是 64kB/s。尽管这三种用户终端的接入方式不同,接入速率也不同,其得到的服务则是相同的。它的人机界面为 Windows 界面,因而可以提供复杂的人机交互方式来获得真彩色的静止照片、无失真的二值图片、手绘真迹图形和文字、各种图表、曲线和文字,还有声音和合成音乐。终端所得到的声、文、图信息是以同步方式经多通道向用户提供的。

多媒体可视图文接入点设备是系统中的核心设备,它实现对用户终端的管理、对数据库的路由寻找、计费、统计等功能。它还要与业务管理中心进行通信,接受业务管理中心的各项管理命令,并向业务管理中心报告状态信息。多媒体可视图文接入点设备提供五种网络接口,其中三种网络接口是面向用户的,这三种网络接口是:电话网通信接口(通信速率为 14.4kB/s)、综合业务数字网通信接口(通信速率为 D=16kB/s,2B=144kB/s)和专线用户接口(通信速率为 64kB/s)。另外两种网络接口是面向数据库的,这两种网络接口是:分组网通信接口(通信速率为 64kB/s),它主要是用于和文本数据库、脚本数据库以及业已运行的所有可视图文数据库相连,以获取信息; 局域网通信接口(通信速率为 10MB/s),它主要是用于和图像数据库、声音数据库相连,还可以通过专用集线器与 ATM 交换系统相连,或通过网关与因特网相接以提供宽带广域通路。

多媒体可视图文数据库有四类,一类为文本数据库,这类数据库与现在已经运行着的可视图文数据库没有本质上的不同,不同之处在于它提供超级文本链接,它主要是提供文字和简单图形信息内容;第二类数据库为脚本数据库。这是一类很特殊的数据库,它主要是为了能实现声、文、图同步而专门设计的数据库;第三类数据库是图像数据库和复合对象数据库,它存放经过压缩的彩色图像、不失真二值图像等信息。这是面向对象的数据库,它还存放复合的多媒体对象信息;第四类数据库是声音和音乐数据库,它存放经过压缩的声音和音乐,它也是面向对象的数据库。多媒体可视图文系统中, 声、文、图是分别存放在不同的数据库中,在终端程序的调度下,经由不同的信息通道,由数据库将数据信息传送给终端,这些信息在终端同步起来, 向用户提供多媒体信息服务。

业务管理中心是实行全网业务管理的,多媒体可视图文系统是一种业务统一管理、计费统一管理的集中式管理信息系统。业务统一管理指的是数据库的登记、删除、系统中数据库目录的编制是统一管理的。信息系统的业务统一管理给用户的使用带来极大方便,用户对在网的信息资源,可从多媒体接入点设备提供的数据库目录中一览无遗,网中接入点设备的数据库目录正是业务管理中心编制并下载下来的。业务管理中心除了实现全网业务管理外,还对全网的接入点设备进行监控.并向全网采集统计信息,从而确保全网的服务质量。

多媒体可视图文系统中的网关是专门为因特网设置的,多媒体可视图文终端用户通过网关进入因特网获取信息,并可和因特网用户交换信息。

多媒体可视图文系统是严格遵循国际标准来实现的。在通信系统中,国际标准化是很重要的。多媒体可视图文系统是现有可视图文系统从通信业务层次上向高技术发展的延续。因而在现有可视图文系统中应用的全部国际标准,在多媒体可视图文系统中将全部采用。此外,在多媒体可视图文系统中还采用了如下一些国际标准。

增强型可视图文人机接口(VEMMI)

可视图文系统中,用户终端与系统的界面是简单的问答式交互界面,用户终端可采用基于 DOS 的接口方式。在多媒体可视图文系统中,人与系统的接口大大复杂化了,必须使用 Windows 的人机接口方式,国际电联提出的VEMMI 协议就是这样的一种人机接口。要指出的是,Windows 是 PC 机本机的人机接口,而 VEMMI 则是一种具有 Windows 接口功能、终端与远地数据库之间的人机接口协议,这是一个很复杂的协议,多媒体可视图文系统中实现了这一协议。

多媒体可视图文系统的应用层协议

多媒体可视图文系统中,用户终端与系统中信息流的交互再不会是简单的单一信息流,而是多种信息流的工作状态。根据脚本中对信息流的安排, 或者复合对象中各种不同信息流间的关系,多种信息流的开发工作情况是要考虑的。多媒体可视图文的应用层协议正是针对此来设计的。它除了有一条主信道外,还可有若干与主信道同时工作的辅助信道,它们可以用于同时传送文本、语音、音乐和图像信息。多媒体可视图文系统中采用了这一建议并实现了它。

多媒体可视图文系统中的表示层句法

多媒体可视图文系统是一种资源受限的通信系统,即通信速率受限和终端存储量受限。为了要在资源受限的通信系统中有很好的效率和很好的服务质量,系统中大量采用先进、高效的编码技术,如文本、图形编码继续沿用可视图文表示层句法;曲线采用区域增量编码技术,这是 ISO 和 ITUT 两大国际标准化组织从最优的六种增量编码方案中优化出来的,它对手写真迹文本有最佳的压缩效率;二值图像采用 JBIG 算法,这是基于自适应算术编码算法基础之上,是目前最佳二值图像压缩算法;彩色静止图像采用 JPEG 算法,这是基于离散余弦变换(DCT)算法,理论已经证明,DCT 是仅次于卡一洛变换的准最佳算法,加之它有快速算法,因此是目前国际标准化了的一种很好的算法;声音采用两种压缩编码算法,其符合 ITUTT.101 建议 AnnexE,码率为8kb/s 和 16kb/s 两种语音;音乐采用 MIDI 编码,这是一种合成音乐。由于通信信道速率受限,没有引入运动图像的压缩编码算法。

多媒体可视图文系统中的同步

同步是多媒体通信系统中的一个极为重要的特征。在多媒体通信系统中,同步可以在三个层面上实现,这三个层面分别为:帧级、表示层级和应用层级。多媒体可视图文系统中不引入运动图像,因而没有帧级层面的同步。它在应用层级进行了同步,即应用脚本技术来实现的;它在表示层级进行了同步,这一同步是在构成复合对象时引入时间同步和空间同步机构来实现的。

多媒体可视图文系统中的超文本技术多媒体可视图文系统中,大

量采用超级文本技本

超级文本是一种非线性的文本组织方式,特别适合计算机中文本的组织。多媒体可视图文系统中利用敏感区(图像)和敏感字段(文本)作为超级链,以此来链接内容相关的文本从而构成超级文本。由于大量采用了 1994 年以后的国际标准,因而多媒体可视图文系统在技术上是先进的,也确保了系统良好的继承性和可发展性。多媒体可视图文系统中还大量采用面向对象技术。用户接口、用户终端、接入点设备和数据库都采用面向对象技术。用户与系统的接入协议(VEMMI)是面向对象的接口协议;用户终端的体系结构是面向“脚本”、面向对象的;数据库管理系统也是面向对象的。

多媒体可视图文系统的应用领域极为宽广。从大类来分,可用于如下三个方面:

  1. 多媒体信息检索

这是多媒体可视图文系统的最主要功能,用户通过终端提供的多种人机交互方法,向数据库索取各种数据资料。在用户和数据库间进行交互式人机通信过程中,用户只读取数据库中的数据,不改变数据库中的任何内容。这类业务很多,如电子图书馆、电子新闻、电子报纸、电子杂志、法律、文化艺术、体育消息、旅游资料、百科全书等。

  1. 多媒体交易型业务

这是多媒体可视图文系统的重要功能,用户通过终端提供的多种人机交互方法,不仅向数据库索取各种数据资料,还要修改数据库的内容。在用户和数据库主机间进行的人机通信过程中,用户对数据库的操作是一个“既读又写”的过程。这类业务的典型应用有:电子银行、电子购物、证券期货交易、房地产交易、机票预定和客房预约等。

  1. 多媒体消息业务

多媒体消息处理业务是一种存储转发型业务,是一种人→机→人的通信业务。当用户 A 要将多媒体信息传送给用户 B 时,他先通过系统将信息存在某一个确定的数据库主机中,用户 B 通过系统从该数据库主机中获取由 A 放入的信息,从而实现多媒体信息由用户 A 向用户 B 的传送过程,数据库主机起到存储转发的功能。这类业务的典型应用有:多媒体电子信箱和多媒体文件传送。

多媒体可视图文是新一代的信息检索系统,它采用了大量新技术和全面采用了最新国际标准,它将是今后多媒体远程信息检索系统的主流系统之一。