电脑中的信息编码

我们已经知道,计算机中的数值是以二进制的形式存储的。事实上,计算机中其它各类数据也都以二进制的形式存储,或者说,是以“0”和“1” 编成二进制数码实现的。

存储单位

计算机存储信息的最小单位是一个二进制数位(Binarydigit),简称 bit

(比特,位)。最基本的存储单元由 8 个二进制位组成,称为 Byte(拜特, 字节)。一个字节可存放一个字符。在计算机中,字节是一个不可分割的基本存储单元。

在实际应用中,还经常使用 KB(KiloBytes,千字节),MB(MegaBytes 兆字节),GB(GigaBytes,吉字节)作为存储信息容量的单位。其中 KB 表示 210,即 1024 字节,MB 表示 220 字节,即约 1 百万字节,GB 表示 230 字节, 即约 10 亿字节。

ASCII 码

计算机中的字符,比如英文字母,阿拉伯数字和许多符号,国际上广泛使用 ASCII 码(American Standard Code forInformation Interchange,即美国标准信息交换码)表示,参见《第十五册附录》。它已被国际标准化组织接收为国际标准,称为 ISO—646。目前常用的是 7 位 ASCII 码版本。它用一个字节表示一个字符,每个字节的最高位为标识位,恒定为 0,其余 7 位编成 27=128 个代码,表示 128 个字符。其中包括大、小写英文字母、阿拉伯数字和一些运算符号、标点符号和控制字符。

附录一中字符的排列顺序用十进制和十六进制两种形式的序号给出,其中用十六进制数所表示的二进制数码是 ASCII 码的实际存储方式。

表中序号为 32 的字符为 SP(SpaceCharacter),表示一个空格。

序号由 0~31 的前 32 个字符和最后一个字符为控制字符,它们不代表可显示和打印的字符,是对计算机及其外部设备起控制作用的字符。比如 CR

(Carriage ReturnCharacter)称为回车字符,是使显示和打印装置换行的字符;BS(Back Spacecharacter)称为退格字符,是使显示和打印装置倒退一个位置的控制字符;BEL(Bell Ckaracter)称为报警字符,它使发声装置发出报警信号。