第二节 计算机信息检索系统

计算机信息检索系统就是利用计算机的有效存贮和查找能力来进行信息的分析、组织、存贮和查找的系统。

一、计算机信息检索系统的构成

计算机信息检索系统主要由三个部分构成,即硬件部分、软件部分和信息数据库。

(一)硬件部分

硬件是指以计算机主机为中心的一系列机器设备,包括主机、外围设备以及与数据处理或数据传送有关的其他设备。

主机可以是大、中型计算机,也可以是微型机,它负责整个系统的运行和管理,一般应具有较高的运算速度和较快的响应速度,同时还要有较强的逻辑运算能力及对大量文献或数据的处理能力。

外围设备包括外部存贮器、输入输出设备等。存贮器用以存贮原始数据、程序和计算结果。外部存贮器主要包括磁带、磁盘、光盘等。输入输出设备包括各种必要的数据录入装置和输出装置,输入设备有数据录入设备、键盘、鼠标器、光笔、缩微扫描器等;输出设备有显示终端、打印机等。

其它与数据处理或数据传送有关的硬件设备还有运算器、控制器等。运算器主要用以对数据进行运算、比较、判断、组合等加工处理,从而完成计算机的计算工作,其运算结果传送到存贮器中。控制器主要控制输入输出设备、内外存贮器和运算器,使之按照程序的规定,产生所需要的命令,并控制命令的执行和信息处理。

广义地讲,硬件设备还应包括电源设备和通信设备及网络设备。

(二)软件部分

计算机软件又称计算机程序,是指控制计算机进行各种作业的一系列指令和进行“人机对话”及各种数据的存贮和传输的“翻译”规则。软件都存放在磁盘或磁带上,也可固定存放在主存贮器中,一旦需要就可取出并送到控制器中,控制器则按程序中的指令操纵各个部件进行工作。软件包括操作系统软件、语言编译软件、应用软件和用户软件等。没有这些软件,计算机就不能运行。

(三)数据库

数据库是计算机信息检索的重要组成部分。它是以二进制代码形式在计算机存贮设备上(如磁带、磁盘和光盘等)合理存放的相关数据的信息集合, 通常由存贮信息记录及其索引的若干文档组成。不同的数据库,存贮不同主题、数量、时间和类型信息的。

目前,大多数计算机信息检索系统都存有四种类型的数据库:文献型数据库、数值型数据库、词典型数据库和全文型数据库。

  1. 文献型数据库,又叫书目型数据库。记录文档中主要存入的是原始文献的书目,例如:原始文献的篇名、作者、文献出处、文摘、关键词等,主

要用于查询各种文献资料的书目性线索、文摘等。

  1. 数值型数据库。数据库的记录存入各种调查数据或统计数据。它是一种以自然数值形式表示、计算机可读的数据集合,这些数据是从文献中分析、概括、提取出来,或以调研、观测及统计工作中直接获得的数据。数值型数据库主要用于查询各种有关的数字、参数、公式等。

  2. 词典型数值库。这类数据库的文献记录主要介绍一些有关公司、团体或名人的情况,供用户查询某一事物发生的时间、地点、过程或简要情况, 或诸如化学物质名称、结构、俗称和化学物质登记号之类指南性信息,故又称之为指南型数据库。

  3. 全文型数据库。这类数据库的文献记录存入了原始信息的正文。通过它可以直接检索出原始信息的全文,而不必进行二次检索,从而大大方便了用户,也提高了信息的有效利用。但是,目前大多数的全文型数据库的记录中还没有能包含原始文献中的图表。同时,全文型数据库需要占用更多的存贮空间,因而,目前的国际联机信息检索系统中,多半还是一些涉及金融、商业、市场或时市等方面信息的全文型数据库,而涉及科技方面的全文型数据库还不多见。

二、计算机信息检索系统的服务方式

目前,计算机信息检索系统主要有以下几种服务方式:

(一)追溯检索服务

追溯检索是根据用户的检索要求,对检索系统中积累多年文献资料的数据库进行检索,查找一定时间范围以内或特定时间以前的文献,这是联机检索中最常用的检索方式。

运用追溯检索,一次就能了解一定时期以来积累的全部有关信息,非常适合于科技研究工作中对信息的需求。

(二)定题信息服务

这种检索是将用户预先确定好的检索提问式长期保留在检索系统的中央计算机中,中央计算机在相应数据库更新时,自动按保留的检索提问的要求将存贮到数据库中有关的最新信息记录检索出来提供给用户。这对长期以来某一专题研究或开发,而又需要长期跟踪其最新动态的用户特别有用。

(三)光盘服务

随着光盘技术的发展,一些计算机检索系统,尤其是大型国际联机检索系统还开展了光盘服务。例如,从 1987 年开始,DIALOG 系统已经可以向用户提供部分数据库的光盘盘片,并可提供与之配用的软件和所需设备,盘片可以每季节更新一次。这种局部系统可以独立进行检索。如果不能完全满足信息需求时,用户可以随即通过联机进行补充检索。