信息、数据和数据处理

计算机处理的电子数据,来自于现实世界的信息。信息是现实世界在人脑中的抽象反映,是通过人的感官感知出来并经过人脑的加工而形成的反映现实世界中事物的概念。这里所说的“事物”不仅是那些看得见、摸得着的物体,而且也包括那些不可触及的抽象概念,如产量、质量、速度等。因此信息可以看作是现实世界的真实反映。信息不仅为人们所认识和理解,而且能够把它作为知识来进行推理、加工和传播,从而达到认识世界、改造世界的目的。

在用计算机处理信息的时候,要将信息转比为计算机可以识别的符号, 也就是数据。数据是表示信息的一种手段。比如对一本书的认识——信息, 可以在计算机中表示为标题、作者、开本、价格、出版社、提要和全文等等符号化的数据。

事物——信息——数据,实际上贯穿了三个世界,即现实世界——信息世界——计算机世界。

现实世界存在着各种物体的集合,如某个班集体、书、零件等,这些可以称为事物类,事物类也可以是某种抽象概念的集合,如成绩。这是现实世界中进行管理的基础。每一个事物类都有具体的事物组成,如某班集体的学生,可以是张三、李四等。每一个具体的事物又具有自己的内涵,如张三具有姓名、性别等内涵。事物类、事物、内涵构成三个层次,与事物、内涵相对应的是实体和属体。

在数据世界,即计算机世界中,与三个层次对应的概念分别是文件、记录和字段。三个世界的类比关系可由表 1。

表 1.1 三个世界的类比关系

现实世界

信息世界

数据世界

事物类

实体集

文件

事物

实体

记录

内涵

属性

字段

表 1.2 数据世界的事物表示形式

姓名

性别

出生日期 籍贯

地址

张三

1969.11 北京

北京师范大学

李四

1966.08 山西

北京大学

认识到了现实世界中的事物可以表示成计算机世界的数据,计算机就有了进行数据处理的基础。数据处理正是对各种形式的数据进行收集、储存、加工和传播的一系列活动的总和。其目的是从大量的、原始的数据中抽取、推导出对人们有价值的信息,作为行动和决策的依据;是为了借助计算机科学地保存和管理复杂的大量的数据,以便人们能方便而充分地利用这些宝贵的信息资源。比如说,对天文观测的数据处理,可以预报天气的变化;对经济运行中产生的数据处理,可以帮助制定科学的经济政策;当计算机保存并处理了图书馆的书刊数据时,就可以迅速从浩瀚的书海中迅速找到所需的资料。借助于计算机网络,数据处理可以使人们在社会活动中如虎添翼。如在北京可以迅速得知上海的商业行情;从中国可以得到美国的某篇文献的原文。这一切均来自于计算机的对电子数据的处理功能。

现在让我们来思考一下,上文中所述及的计算机完成的种种功能如何才能实现呢?要想对数据进行处理,首先要作的是对数据的分类、组织、储存、索引和维护等。这些工作是数据处理的基本环节,这些工作统称为数据管理。