科学数据库管理系统

在 70 年代商用数据库管理系统已广泛应用到科学技术界,使用这种软件的主要好处是它提出了数据模型化的方法,对理解数据结构有好处。

另外,无论是信息的提供者和信息需求者都可不必了解计算机的复杂性。例如 IBM 公司的 IBS 是一个层次模型的数据库管理系统,已用于为医学研究建立的嗜血杆菌数据库;欧洲经济合作与开发组织(OECD)的核能数据库(NEADB)使用了在 PDP11/70 计算机上的 DBMS-11(CODASYL 网状 DBMS)。

剑桥结晶学数据中心利用了 ADABAS(德国 AG 软件公司生产的 DBMS)开发并建立金属有机化合物质子坐标信息数据库。

加拿大国家重力数据库使用了 SYSTEM2000(层次模型的 DBMS)。

美国的戴尔斯伯里(Daresbury)实验室的科学和工程研究委员会用关系

数据库管理系统RAPPORT 建立了数据采集系统,英国森林委员会也用RAPPORT 管理了树木测量方面的观测数据及实验数据,可直接用交互式查询语言,也可用高级程序设计语言扩充其功能。

美国斯坦福大学开发的 SPLRAS 是一个汇编成的层次数据库系统,已在美国、加拿大和英国建立了各种科学数据库等。但是,科学数据库系统与商用数据库系统是有很大差别的。商业数据库系统的典型应用是企业、工厂的管理控制,如材料、帐单、价格、市场信息等综合数据的管理,建数据库的目的是为集中控制过程用的数据资料,建库部门可直接从中得到收益。

数据来源是公司和企业生产部门的管理用和控制用数据,这样的数据记录一般不特别长,基本由字母数据串组成,数值数据通常是整数、浮点数。用户使用数据的查询要求一般是对数据项定义值的询问,可包括报表显示及绘图输出,准确度和保密性要求高,绝对不允许有错。

科学数据库的典型应用是联机数据查询、数据计算、数据编辑。建库的目的以服务为主,提供已有的科学技术数据信息,促进了社会各部门的发展。建库部门不能直接从中得到效益。

数据来源于科技工作者的实验室、观测台及已有的出版物,数据类型可为固定长或可变长,一个单个记录可以很长,如微生物性状库数据记录可达1 万字节,晶体结构数据库记录可达 7 千字节,基本粒子物理数据库中记录

可达 8 万字节。数据可以是位串、矢量、数组或图象。查询用户可提出允许误差的范围检索,输出的显示要求可能是字母数字串,此上、下标的多维表及图形。由于它们以公益服务性为主,所以保密要求一般不高。

科学技术数据的性质比商用数据复杂,使用这类数据库的科学家和工程师要求数据相当精确,对数据库的管理也更为复杂。建库时需要仔细研究各因素和进行系统化的分析。在数据库中放置科学技术信息并不难,但获取有用的信息输出往往非常困难,目前还没有一个能适用于建立各科学数据库的管理系统,正如前面介绍过的,不少科学数据库的设计者与开发者正在使用现有的商用数据库管理系统,也有的部门结合具体的专用要求,开发了相应的数据管理程序。这样的科学数据库系统分为单一的数据库系统、多用户单一应用的数据库系统和多用户多应用的数据库系统。它们一般都包括如下三类程序,即数据检验和数据装入过程程序;数据库查询程序;与外部程序包如与统计分析包,分析算法包,报表及图形,数据显示及印刷输出等程序接口。