数据库技术面临挑战

  1. 信息爆炸可能产生大量垃圾。随着社会的信息化进程的加快,信息量剧增,大量的信息来不及组织和处理。例如,美国宇航局近年来从空间收集了大量的数据,美国“陆地”卫星每两周就可以拍摄一次整个地球表面, 该卫星运行近 20 年来的 95%的信息还没有人看过。现在还没有这样的数据库可供存储和检索如此大量的数据。再有,美国国会通过一个 30 亿美元的计算,准备构造全人类基因组的 DNA 排列图谱。每个基因组的 DNA 排列长达几十亿个元素,每个元素又是一个复杂机构的数据单元、据估计,人类的基因组约有 5~6 万种,如何表示、访问和处理这样的图谱结构数据,是数据库面临的难题。进入 90 年代,像这样的数据并不罕见,传统的数据库技术受到了挑战。

  2. 数据类型的多样化和一体化要求。传统的数据库技术基本上是面向记录的,以字符表示的格式化数据为主,这远远不能满足多种多样的信息类型需求。新的数据库系统应能支持各种静态和动态的数据,如图形、图象、语音、文本、视频、动画、音乐等。

在许多计算机应用中,例如地图、地质图、空间或平面布置图、机器人控制、人工视觉、无人驾驶、医学图象等,常涉及到许多空间属性,例如方向、位置、距离是否覆盖或重叠等。目前,这类数据的表示和处理都由应用程序解决,数据库给予的直接支持很少。两者之间缺少亲近性,随着这类应用的增多,数据量的扩大和共享程度的提高,有必要由数据库系统来管理, 这就需要发展相应的数据模型、数据语言和访问方法。

更为重要的,人们对信息的使用常常是综合性的,图形、图象、语音、文本、数据之间常常发生交叉调用,需能运多种手段(图标、声音、表格、命令、语言)综合进行存储检索、管理,这是计算机系统和信息系统逐步走向多媒体化的自然要求。从数据库系统来说,要解决多媒体数据的管理问题。DBMS 虽然以支持多媒体数据作为其研制的主要目标之一,但是投入实用还有相当大的困难,尤其在性能上还很难满足多媒体数据一体化处理的要求。目前,多媒体数据基本上靠嵌在关系模式中的文件系统或记录来支持,但数据量大了,数据结构复杂了,共享的要求高了,靠文件系统显然是很难适应的。研制实用化的多媒体数据库对关系数据模型和单一数据类型提出了严峻的挑战。

  1. 当前的数据库技术还不能处理不确定或不精确的模糊信息。目前, 一般数据库的数据,除空值外都是确定的,而且认为是现实世界的真实反映。

但是实际生活中要求在数据库中能表示、处理不确定和不精确的数据。例如, 有些数据不知道确定值,只知道它属于某一集合或某一范围;也有些数据是随机性的,只知道它的不同值出现的概率;还有些数据是模糊的,它的值只是它的“可能”值,或者用自然语言值表达。推而广之,一个元组、一个关系,甚至整个数据库都可能是模糊的。要支持这类数据,必须对确定数据模型做相应的扩展,甚至要对数据库理论来一场革命。人们对数据库查询的要求也不再是简单的有解(完全符合查询条件的结果)和无解,而可能是模糊解或不确定解,提供模糊查询结果。

  1. 数据库安全。数据库系统的发展方向是在大范围内集成,向广大用户提供方便的服务。今年来便携式计算机大量涌现,因特网扩展延伸,用户将可通过计算机网随时随地访问数据库,这就带来严重的数据库安全和保密问题。不解决这个问题,上述的目标将无法实现。现有的数据库安全措施远不能满足这个要求。在数据库安全模型、访问控制、授权、审计跟踪、数据加密、密钥管理、并发控制等方面都还没有形成明确的主流技术策略。例如, 不管是按数据对象分别给用户授权,还是按数据级和用户密级决定能否访问,都不能可靠地防止泄密。比较可靠的办法是数据加密。但在最近,美国的 RSA 数据安全公司,为迫使美国政府放松密码产品的出口限制,发起了一项名为“秘密密钥挑战”的竞赛。因特网上有数万人加入到破解密码的行动中,采用穷举方法,终于在 96 天之后破解了 56 位 DES 加密算法。这令舆论哗然,也令使用这种加密方法的公司、机构不寒而栗。数据库管理系统的安全机制还涉及到对操作系统安全的要求。

  2. 对数据库理解和知识获取的要求。目前,粗略地说,全世界平均每天诞生 100 个数据库,每 5 年信息量就要翻一番。正如奈斯比特在《大趋势》一书中所描述的:“我们正在被信息所淹没,但我们却由于缺乏知识而感到饥饿。”但是,我们对数据库的使用还停留在操作员查询一级,只能利用数据库去查询已经存放在库中的一些具体的特定的数据。即使这样,查询前用户还必须熟悉有关的数据模式及其语义,为了了解这方面的情况常常要向数据管理员(DBA)请教。这样无法解决语义的歧义问题,更不能为决策者理解数据库的整体特性服务。高层决策者常常希望把自己的数据库作为知识源, 从中提取一些中观的、宏观的知识,希望数据库具有推理、类比、联想、预测能力,甚至能从中得到意想不到的发现,希望数据库能主动而不是被动地提供服务。如商品数据库能根据销售量主动提出调整价格的建议,或者提醒采购库存量已经很少的货物。