文 件
- 文件
由若干个逻辑记录构成的信息集合称为文件。这些记录可以是同一种类型,也可以是不同种类型。在一般意义上,文件表示在目的、形式和内容上彼此相似的信息项的集合。
文件作为某类信息的集合,可在电脑里读写、存储、编译、修改。文件的一切操作、运行、编译、修改都是在内存上进行的。文件的存储可在磁盘、磁带、磁鼓和磁芯等一切磁性介质上进行,也可在光盘上进行。每个文件, 都有一个特定的文件名。文件就是以这个文件名标志着它的存在和运动。人们辨别、调用、读写、存储、运行不同的文件,也都是依靠这些文件名进行的。因此,在一个存储空间,一个文件只有一个文件名,文件名是绝对不能重复的。
- 取文件名规则
文件名就如同人的姓名一样,姓名(name)是一个人的称号,文件名
(filename)也是一个文件的代号。
给人取名是很讲究的,要按姓氏、按辈分、按男女性别来定夺。给文件取名也是有一定规矩的。一个文件的全名由驱动器号、主文件名和扩展名三部分组成。文件全名的格式为:
[d:]filename[.ext]
其中[]中的参数可以省略;[d:]磁盘驱动器号,如:A:,B:,C:, D:,E:等等;filename 主文件名,由 1-8 个字符或 1-4 个汉字组成(注: 现在的 Windows95 支持 78 符字长的文件名)。
[.ext]扩展名,由一个英文句点开始,并紧接着由 0-3 个字符组成。如:“C:COMMAND.COM”就是一个文件全名,它表示文件是在硬盘 C 上,
主名是“COMMAND”,表示是一个命令处理程序。扩展名:“.COM”,表示是一个机器语言命令文件。
- 文件名用字符表示
文件名都是用字符表示,但无论是主名还是扩展名,都不是什么字符都可使用的。人们为了使用文件和设计程序不发生矛盾冲突,作了一些规定:
- 文件名和扩展名的字符可为:英文字母,0-9 的数字,特别字符$、
@、#、!、%、(、)、_、{、}、~。
- 文件名和扩展名不能使用:任何控制符,空格以及字符<>\ˇ+
-=/[]:;,?”*。
- 设备名不能作文件名,但可作为文件名的一部分。4.常用扩展名
下表是部分常用扩展名及其特定的含义。
扩展名 |
约定的含义 |
扩展名 |
约定的含义 |
---|---|---|---|
.ASM |
汇编的程序文件 |
.BAK |
备用文件 |
BAS |
BASIC 程序文件 |
.BAT |
批处理文件 |
.BIN |
二进制程序文件 |
.C |
C 语言源文件 |
.COB |
COBOL 源文件 |
.C |
COM 命令(程序)文件 |
.DAT |
数据文件 |
.DOC |
资料(文本)文件 |
.DTA |
数据文件 |
.EXE |
可执行的程序文件 |
.FOR |
FORTRAN 源文件 |
.HLP |
求助源文件 |
.LIB |
程序库文件 |
.MAP |
连结映像文件 |
.MSG |
程序信息文件 |
.OBJ |
中间目标代码文件 |
.OVL |
程序覆盖文件. |
OVR |
程序覆盖文件 |
.PAS |
PASCAL 源文件 |
.PRN |
列表文件 |
.WPS |
WPS 编辑文件 |
.GIF |
GIF 图片文件 |
.ARJ |
ARJ 压缩文件 |
.FOX |
FOX 编辑文件 |
.DBF |
数据库文件 |
.HLP |
帮助文本文件 |
.SYS |
系统配置文件. |
TMP |
暂存文件 |
.TXT |
文本文件 |
.$$$ |
暂存或错存文件 |
上述由系统指定的扩展名具有特殊的意义,取文件扩展名时,不能随意用这些名字作扩展名。
- 系统文件
系统文件即构成电脑各种工作系统的文件,由各种操作系统及其程序所组成。这类文件一般用汇编语言或编译语言所编写,对用户不直接开放,只能通过系统调用为用户服务。因此,通常又称它为程序文件。程序文件一般都使用 COM 或 EXE 的扩展名。也有使用 HLP、SYS、VID、INI 和 BAS 的。因此用户在使用文件名时,最好不用这些名字作扩展名。
- 汉字库文件
汉字库文件包括汉字显示库及汉字打印字库,有繁体字库和简体字库、高点阵字库和低点阵字库、矢量字库和曲线字库、普通字库和精密字库之分。字库文件由标准子程序及常用的实用程序组成。这类文件的扩展名一般由各汉字系统开发者自行定义。如金山的字库文件为 DOT、PS1、PS2,而 2.13H 的字库文件都不带扩展名。这类文件允许用户使用,但不能修改。
- 用户文件
用户文件又叫数据文件。由用户自己操作时输入电脑。并委托系统保存的文件,如用户编制的源程序、原始数据、文本文件等。这类文件只能由用户自己即文件的主人进行读/写操作或编辑修改。
在用户文件中,常会看到“.BAK”的扩展名,这是用户的备份文件。在WPS 的用户文件中,经常会看到“.%A%”及“.%B%”扩展名的文件,这是用户的临时文件。
- 批处理文件
DOS 命令常在某提示符下打入,回车后系统开始执行,这是通常的用法。但对于经常使用的有规律的一批 DOS 命令,如果逐条地从键盘上打入,便感到执行不方便,于是,DOS 提供了批处理文件这一概念。即事先用某种编辑方法将 DOS 命令一条命令一行地编好,无论是 DOS 内部命令还是外部命令均可,组成一个新文件(文件名任意),扩展名系统规定为 BAT,这样的文件就叫批处理文件。可以理解批命令和普通 DOS 命令作用相同,只不过它内部包含了一批单个的 DOS 命令。
AUTOEXEC.BAT 是一个典型的批处理文件。电脑在启动后自动在根目录中寻找此文件,找到后则自动逐条执行,故一般我们将开机后即要执行的程序放入批处理,避免以后逐条输入执行。
- 可执行文件
可执行文件是指能够运行的程序文件。DOS 可支持两类可执行文件,即“.COM”文件和“.EXE”文件。“.BAT”批处理文件也是一种可执行的文件。凡是可执行的文件,输入了文件名文件就能运行。由于输入执行文件名称时都不打扩展名,因此如果目录里有几个文件主名相同、而扩展名不同的文件时,DOS 要能分辨识别他们的优先等级。DOS 对可执行文件的运行规定了一条既定的执行顺序:当 DOS 操作系统执行某条命令时,先寻找扩展名为“.COM” 再寻找为“.EXE”的文件,找到后便按此文件中的内容逐条执行 DOS 命令, 如果没有查找到,则显示出错信号。因此在编制“.BAT”的批命令里,不要取目录中有同名的文件。特别是不要取有“.COM”、“.EXE”等扩展名的同名文件。
- 文件属性
为方便 DOS 对系统及用户文件的管理,DOS 规定了文件属性这一概念, 这是文件目录项中的一个设置,让每个文件都具备某种属性。文件属性决定着文件的状态,如正常、隐含或只读等等。
文件的属性是登记在磁盘 5-11 扇区的根目录表中。不管是根目录,还是
子目录,在这个目录表中都占用 32 字节长度的“档案”,上面登记着文件的名字、扩展名、属性、长度、文件在盘上的起始位置以及建立和修改此文件的日期和时间。其中 0-7 字节是文件名,8-10 字节是扩展名,第 11 字节是文件属性,22-23 字节是时间,24-25 字节是日期,26-27 字节是文件在磁盘上的起始簇号,28-31 字节是文件长度。DOS 就是根据这个表来对磁盘文件进行管理的。其中文件的属性就是指这个表中第 11 字节里对每个文件的登记。
文件有哪些属性,在目录登记表中是怎样规定的呢? 00H:读写文件,又叫普通文件。其目录在查找时可显示。
01H:只读文件,只能使用,不能修改,即不能用功能调用打开的文件。
02H:隐含文件,隐含起来使目录查找时看不到的文件。
03H:系统文件,目录查找时不显示的文件。
10H:表示该目录是子目录。
20H:归档文件,表示文件完成了写操作并已关闭。
文件的属性是可以修改的。如果要修改文件的属性,用 DOS 命令调出这一个目录表,修改第 11 字节的内容就行了。修改时,可以把上述值进行组合设置,这样,一个文件就可以具有几个属性了。
可用 PCTOOLS 的 File 菜单中的 AttribleChange 来直观地修改文件的属性。
- 文件目录
磁盘可以存放许多文件,使 DOS 操作系统承担起管理磁盘文件的任务。为了便于系统更好地管理文件,系统将文件名集中存放在磁盘特定的位置, 像图书一样,我们称这一特定位置为目录。当磁盘存入一个新文件时,目录便增加有关这个文件的目录内容;删除磁盘某些文件时,目录也会删除相应目录的内容。
DOS 管理文件的具体办法是在磁盘特定的位置上建立目录区和两份内容相同的文件分配表(设两份可增加保险系数,一份坏了用另一份)。
- 目录区
目录区是用以记载文件的名称、属性、长度、建立或修改日期、时间以及文件存放的起簇(簇即磁盘分配块,每簇含 2-16 个连续区,视磁盘的类型和容量而定,磁盘格式化时由 FORMAT 程序确定)位置等信息。其中每个文件在目录区中占用 32 个字节。360K 的软盘目录区共有 7 个扇区(每扇区 512 字节),所以 360K 软盘中存放文件个数最多不能超过 112 个文件。硬盘目录区一般可容纳 512 个文件。
- ASCⅡ码
ASCⅡ码是美国信息交换标准码的英文缩写,是数据通信的标准七位代码。由于电脑里一个字节是 8 位二进制数,因此第 8 位作奇偶校验位。ASC
Ⅱ码的全码有 128 个字符,包括了大小写字母、数字、符号和控制符。大多
数终端使用 96 个子集,不包括通信控制符在内。这个子集也是小型机和电脑通常的内部存储器代码。许多字处理器使用包括大小写字母、数、普通的符号、标点在内的 64 个字符的子集。ASCⅡ码被国际标准化组织所采纳的信息交换标准码。IBM 电脑使用含有 256 个字符的扩展 ASCⅡ码字符集。