第二节 文件的组织形式和存取方式

一、文件的组织形式

文件的组织形式指文件中诸记录或数据在存储介质上的排列形式。一般来说,文件的组织按其内部结构大致分为串行组织、顺序组织、随机组织、索引组织、倒排组织和表结构组织等形式。

1.串行组织

串行组织是最简单的一种文件组织形式,它将记录按出现顺序一个接一个地存放在存储器的某个区中,取用某个记录时只能顺序扫描整个文件。这种组织方法适合于磁带存储器。文件的串行组织方式,较多地用于计算机运行过程中产生的暂时文件以及存档文件。串行组织文件简称为串行文件

(serial file)。2.顺序组织

顺序组织是指文件中诸记录根据关键字(值)的升序或降序的顺序存放在存储介质上的组织形式。实际上,它是经过整理的串行文件。这种组织形式的文件其逻辑顺序和物理顺序是一致的。顾名思义,顺序组织文件的存取只能是以顺序方式进行,它不能任意地对某个记录进行直接存取。

顺序组织形式适用于拥有大量记录,而且变化不频繁的文件,也适用于成批数据顺序存取的场合。顺序组织文件简称为顺序文件。

  1. 随机组织

随机组织指文件中各个记录与其在存储介质上的存放位置之间毫无关系的组织形式。这是用一种算法将记录的键值转换为一个近乎随机的数,根据这个确定记录在存储器上的位置的组织方式。这种随机组织文件,只要确定了某个记录的存储地址(记录键),就可以直接对其进行存取,而不必考虑与其他记录之间的顺序关系。随机组织文件简称为随机文件。

随机文件只能存储在磁盘那样的随机存储设备上,而不能存储在磁带那样的顺序存储设备上。

随机文件可用于联机处理的场合,实现快速地对数据进行随机存取及查询。它不太适用于文件中大部分记录都需要处理的情况。

  1. 索引组织

索引组织形式是把文件中识别各个记录的关键字集中在一起组成一个目录文件(即索引)的组织形式。索引组织形式的文件适用于批处理及联机处理。它的优点是既可以用于顺序操作,又可以用于随机操作。缺点是当文件量较大时,由于目录文件增多,所占存储空间增大。索引组织文件简称为索引文件。

以上所介绍的串行文件、顺序文件、索引文件、随机文件统称“正规文件”(regular file)。所谓“正规”是指它们的组织方法比较简单,有规律,每个记录只用一个关键字来标识。下面将要介绍的倒排组织和表结构组织方法则要借助于多重键或记录之间的指针。

  1. 倒排文件

如前所述,倒排组织文件是通过索引表中相应记录键值,给相应的记录定位的。在倒排组织中,记录有多个键,同时根据这些键来确定一个记录。因此可以把倒排文件视为“多键索引文件”。

  1. 表结构组织

表结构组织简言之就是记录之间互相用指针连接的组织形式。根据需要,一组记录可提供几组指针,这样可形成不同顺序的逻辑文件,因此存取记录十分灵活。在这里指针(pointer)实际上是记录中一个特殊的数据项。一般的数据项,代表记录所表示的实体的某一属性,用于指针的这个数据项则并不代表任何属性,它指出另一记录在存储器上的位置以维持数据的可读取性,同时也反映了数据记录之间的联系。因此,指针在物理存储器组织中起着十分重要的作用。表结构组织是在数据库中用得十分广泛的一种组织形式。