第三节 国际联机信息检索

国际联机检索是用户利用检索系统网络的终端设备,通过国际通讯网络与国际联机检索系统的中央计算机,从检索系统的数据库中查找所需的文献信息资料。

一、国际联机检索系统的组成

国际联机检索系统由计算机中心、数据库文档、检查终端、计算机通信网络几个部分组成。

(一)计算机中心与数据库

安装在联机检索中心的计算机都是大型的分时装置,可供几十个甚至几百个终端同时进行信息存取,其功能是完成信息的存贮、处理和检索等操作, 对整个系统的运行进行管理和控制。供检索用的数据库文档存贮在磁盘上, 磁盘驱动器通过控制装置与计算机相连,可以随时检索存贮在磁盘上的信息内容。

计算机中心通过通信控制器、调制解调器与通讯网络和终端相连。

(二)检索终端

终端是用户与主机进行人机对话的工具,是检索人员将用户的检索要求等信息通过一系列的检索指令传递给远端的计算机,并从计算机接受信息的一种设备。联机检索终端包括终端机、电话机、调制解调器、显示器、打印机等装置。

到目前为止,我国设置的联机检索终端按照连接的数据库系统不同,可分为国际联机检索终端和国内联机检索终端两类。国际联机检索终端是直接通过国际通信网和卫星与国际大型联机检索系统相连的;国内联机终端是通过国内专用电话线路与国内自建的数据库检索系统连接的。按照通信线路类型来分,终端又可分为用户电报终端和公用数据终端两种。前者使用用户电报线路,比较容易解决问题,但传输速度低;后者使用数据或电话通信线路, 速度快,可靠性强,费用低。我国多采用微型机作为联机检索终端。

(三)计算机通信网络

计算机通信网络一般由计算机、终端设备、数据通信网(包括调制解调器和通信线路)、通信控制器(是计算机与远程终端或网络中其它计算机进行通信的控制设备)组成。它可以将地理位置分散的资料实现实时的集中管理,并达到数据库资源、硬件资源、软件资源的共享目的,从而提高检索系统的利用率。计算机通信网络在联机信息检索系统中占有重要的地位,只有有了计算机网络,才可能出现信息检索的联机系统。

在通信网络的线路方面,我国终端用户主要使用用户电报网线路和公共电话交换网线路。前者的优点是可利用本单位的用户电报线路和电传机作终端,缺点是费用较高,速度慢。后者的优势是传输速度高,质量好,国内大多数国际联机检索终端都采用用户电话网线路,当用户多、数据传输量大时, 宜采用专线方式;当用户少时、数据传输量小时,宜采用电话拨号方式。这两种方式各有利弊,应视具体情况而定。此外,还有第三种线路,即公共数据网线路,它与上述两种线路不同,具有持续时间短、误码率低、传输速度快的优点。我国的联机检索系统的通信线路正在向公共数据网的方向过渡。

二、国际联机信息检索的优点

国际联机信息检索克服了地理位置的限制,又兼有一般计算机检索的特长,使其具有许多优点。主要表现在以下几个方面。

(一)检索范围广

建立在卫星及其它现代通信网络基础之上的国际联机检索系统,使得用户打破了使用信息的空间界限,检索者不论在哪一国家或地区,只要有一台联机终端,就可检索网上所有机检数据库中的各类信息。现在许多联机检索系统通过国际或国内通信网络,与设置在世界各地的终端相连,供用户检索, 而速度和效果不受用户地理条件的影响。可以说,国际联机检索系统最大限度地体现着人类信息资源共享的现代特点。

(二)数据库种类多、数量大

许多国际联机检索系统都拥有各种学科领域的数据库,系统的数据库种类多,信息存贮量大。有的国际联机系统甚至拥有几百个至上千个数据库, 收录几千万篇或上亿篇文献或记录,可满足各种专业和行业的用户需求。例如,仅 DIA- LOG 系统就有近 300 个数据库可供检索,信息的类型可以是文献型、数值型或者事实型,文献的出版形式可以是期刊、图书、报告、专刊、会议录等,它们以世界上所有重要文种出版,来自世界上所有国家地区。据统计,世界上公开发行的文献,80%都可以通过国际联机系统查到。

(三)检索速度快

由于计算机具有高速处理信息的能力,所以它可以使用户在最短的时间里,以最快的速度获得所需文献信息。国际联机检索的主机,大都能每秒执行几千万条指令,一般用户发出命令 5 秒钟内即可将命中文献的篇数显示到用户的终端屏幕上,检索一个课题只需几分钟。

检索速度快还体现在另一方面,即从原始文献的出版到它们在检索系统中得到报道的时差比较短。各数据库的更新周期一般都不长,多则一个季度, 少则半月乃至一周,因此最新文献很快就能在数据库中得到反映。当前,绝大多数书本式检索工具都是由计算机在其机检数据库的基础上编制的。显然,书本式检索刊物报道文献要比机检数据库晚一些。在我国,往往已收到报道某一篇文章的磁带版数据库,还未收到登载该篇文章的原版期刊。如果利用国际终端,进行联机检索,还会得到更新的文献线索。

(四)检索途径多,检索效果好

联机检索系统可以提供众多的检索途径,用户可根据需要运用多种检索方法进行查检。用户能够自行确定检索词,或用布尔逻辑算符和位置算符将多个检索词进行组配查找,也可指定任意信息属性,如主题词、著者、出版单位,文献篇名、期刊刊名、出版年代等为检索途径。而且可以通过人机对话,扩大或缩小检索范围,不断修改与调整检索策略,以达到满意的查全率和查准率,确保检索的最佳效果。

(五)具有灵活的服务方式和输出方式

一般大型的联机检索系统都提供回溯检索、定题检索、联机订购原文乃至联机通信等多种服务项目。如可通过联机系统订购原始文献的复印件。因为用户通过联机检索后,获得的都是二次文献,当用户需要文献资料的原文而在当地馆藏中又找不到时,则可利用联机检索系统利用原文的服务,向提供原文的机构订购原文的复印件或缩微平片。另外,联机检索的结果可联机显示并打印,也可脱机打印,还可将联机结果存盘,以便重新编辑整理使用。输出格式有多种选择,既可输出数据库中的完整文献记录,也可输出篇名、出处等某些字段,或根据需要安排安段的排序,并编成专题目录、信息资料通报等。有的系统还可输出缩微形式的原始文献。

(六)检索全面

由于当今各学科的文献资料分布异常分散,因而给全面查找某学科的文献信息带来了一定的困难。据统计,一般只有 50%左右的文献资料刊登在相应学科的杂志上,而其余部分则分散在其他学科的杂志上,对边缘学科、新型学科更是如此。而联机检索可以很容易地做到在检索系统的不同数据库中进行搜索,只需几分钟到十几分钟就可以得到全面而具体的结果,大大节约了查寻时间,保证了查全率。

三、世界著名的国际联机检索系统简介

(一) DIALOG 系统

DIALOG 系统又称 DIALOG 对话系统,因研究人机对话检索方式而得名。它是目前世界上最大的国际联机检索系统,也是我国信息用户使用最多的系统。1963 年系统创建初期,曾是美国洛克希德导弹和空间公司下属的一个情报科学实验室。当时规模很小,实验室仅有一台 IBM360/30 型计算机,用于进行信息检索试验。1966 年,DIALOG 系统与美国国家宇航局的艾姆斯研究中心合作进行联机检索的实验,通过电话线路,从一台终端上检索研究中心图书馆存贮 20 多万条文献记录的数据库。1972 年,DIALOG 系统开始成为国际联机检索系统,正式对外开展联机文献检索服务业务。之后,其规模不断扩大,影响越来越广,联机检索业务逐渐发展到加拿大、欧洲、日本、澳大利亚乃至第三世界国家。

1981 年 6 月,该系统正式宣布作为洛克希德公司的子公司,独立经营检索业务。其总部设在美国加利福尼亚州的帕洛阳尔托(Palo Alto)市。目前, 该系统的联机服务网遍布世界 70 多个国家和地区的 200 多个城市,共设有联

机检索终端 25000 余台。系统中各类型数据库数量的发展速度相当快,到1987

年 6 月,系统总计拥有 300 多个数据库,存贮的文献超过一亿条,占世界机检文献总量的 50%以上。

DIALOG 系统各文档涉及的学科范围相当广泛,包括自然科学、应用科学、社会和人文科学及各种综合学科和交叉学科等。另外还包括关于市场行情、时事报道、数据统计、经济预测和机构名录等方面的信息。文献类型有: 书刊、报纸、学位论文、研究报告、专利、标准等。其服务方式除定题服务、追溯检索等常规服务外,还提供多文档检索服务、家庭检索服务、电子邮件服务、原文订购服务、光盘检索服务等。

1988 年,洛克希德公司将 DIALOG 系统以总共 3.53 亿美元转卖给一家报纸和电视通讯公司(Knight-Ridder 公司)。

(二) ORBIT 系统

ORBIT 系统即书目情报分时联机检索系统,是美国系统发展公司(SDC) 与美国国际部于 1963 年共同开发的联机检索系统。总部原设在美国加利福尼亚州的 Santa Monica 市,是仅次于 DIALOG 系统的第二大国际联机检索系统。

ORBIT 系统于 1965 年在美国国内实现联机检索,1974 年发展为国际联机检索系统。1987 年脱离美国系统发展公司,与英国的 Infoline 系统共同归属于英国 Pergamon 公司集团新建的 Pergamon Orbit Service 公司。新公司成立 orbit 检索服务部,并将总部移至弗吉尼亚州的 Reston 市。

目前该系统已拥有 2 万多台终端,遍及世界许多国家和地区的大城市。

该系统拥有 90 多个数据库,分两种类型:书目型数据库和指南型数据库,涉及的专业范围有化学、能源、工程、生物工艺学、计算机科学、商业经济以及其他一些自然科学和社会科学。存贮的文献类型有:图书、期刊、会议论文、专利、年度报告、政府法规、产品规格、统计数据、报纸评论等。其特点是对汽车工程、石油、化工、医学、环境科学、安全科学、运动科学、专利等方面的文献收录较齐全,并对一批使用价值较高的数据库拥有独家经营服务权。

(三)BRS 系统

BRS 系统即存贮与信息检索系统,成立于 1976 年,1979 年投入商业性运

营,总部设在美国纽约。

BRS 系统 80 年代末已拥有 150 个公用数据库,40 多个私人数据库,其中大部分为书目数据库。数据库内容包括社会科学、人文科学、商业经济、教育、医学、生物化学、工程技术等。文献类型不仅包括了各类书目文献,还收集有关专刊、政府报告、标准、工业产品说明等。该系统在 1980 年率先实

现了全文检索,建立了 20 多个全文数据库,对当天出版的期刊也可立即存

入。在期刊数据库中,有 100 多种可实现联机全文检索。目前,文献存贮量

达 5000 多万篇,用户 4 万多个。该系统还以优惠政策为我国用户服务,即系统中所有数据都对中国开放,并按美国国内最低标准收费。同时,为满足我国用户需要,增加了五个有关产品和标准的数据库,并可用缩微方式提供原始资料复制品。

(四)ESA-IRS 系统

ESA-IRS 系统是欧洲航天局信息检索服务处的英文缩写。简称 ESA 系统, 是欧洲最大的文献检索系统,也是世界上最重要的检索系统之一。该系统是欧洲航天局的一个下属单位,成立于 1964 年,当时叫做欧洲空间文献中心

(SDS),总部设在巴黎。1973 年改名为 ESA-IRS,并将总部迁往意大利罗马附近的弗拉斯拉蒂(Frascati)市。除西欧外,系统的联机检索终端还遍及美洲、北非、中东、澳大利亚和亚洲的许多国家和地区。

ESA 系统有 100 多个文档,总计存贮 3000 万条书目数据。专业范围包括航空、航天和宇宙空间、天文学、天体物理、环境与污染、地理学、海洋学、化工、经济、管理和社会科学等多种学科,但没有专利文献数据库。ESA 系统包括的数据库有近一半与 DIALOG 系统或 ORBIT 系统系统相重迭。但某些数据库独具特色,如法国文摘通报数据库、原材料价格数据库等。它在装库方面也具有其他系统所没有的特色,即把规模大的数据库,不管是最新部分, 还是追溯部分,都维持在一个文档中,避免了用户分别检索几个子库的麻烦。

ESA 系统提供的服务除回溯检索、定题检索和联机订购原文等项目外, 还提供用户之间的快速通信业务,并可联机结算用户帐目。

(五) STN 系统

STN 系统即国际科技信息网络系统,是由美国化学文摘社(CAS)、德国卡尔斯鲁厄能源、物理、数学专业情报中心(FIZ)和日本国际化学情报协会

(JAICI)三家联合经营的国际联机检索系统,1983 年底开始筹建,1986 年初正式对外服务。其服务中心设在德国的卡尔斯鲁厄、美国的哥伦布和日本的东京三处。每一个中心分工建立一部分数据库,同一个数据库只存贮在一处。美国的化学文摘社主要建立化学文摘数据库;德国能源、物理、数学专业情报中心主要建立能源、物理、数学等方面的数据库;日本化学情报协会主要把现有的化学化工方面的数据库转入 STN 系统。

到 1989 年,三个中心共向系统投入 83 个数据库,约 6000 万条记录。虽STN 系统所收录的数据库与其它系统有很多重复,但 STN 系统还收录了一些独特的数据库。如由德国专利局提供的德国专利数据库,它是目录、全文、图像三结合的数据库。另外,STN 系统拥有世界上第一批联机图像数据库, 如美国化学文摘社的化学物质结构图形库、贝尔斯登有机化学大全结构数据库等。

STN 被设计成为全球范围可供检索的系统,每天工作 24 小时,其不同国家合作经营的方式使它在国际联机检索服务市场中具有较强的竞争力。