谁解其中味:深入浅出

众所周知,文字是一种信息符号,汉字也不例外,汉字编码则是用一些字母或数字代表这个汉字,最完美的编码方法应该能够使代表汉字的字符串最大程度地表达汉字本身所代表的信息。与万“码”奔腾的各种编码相比, 码根码的确可以说是一枝独秀。不少用户将码根码誉为“天下第一码”、“最合理编码方式”和“最低重码率编码”,自有其道理。冯天岳为码根码起的“学名”是“电脑汉字大字符码根输入法”,它最与众不同的特点就是用“码根”(最基本的部首根代码)进行编码。

对于码根码,冯天岳有一番精彩之论:“汉字里,两笔划以上的都叫‘字根’,这些字根里有一部分可以直接有代码,但并不是所有的字根都允许有代码,这一部分有代码的字根简称为‘码根’。‘码根’是汉字最基本的组成部分,像组成物质的分子,而字根是由码根构成的,所有的码根通过不同的组合,组成不同的汉字。过去,汉字输入法之所复杂难学正是因为混淆了‘字根”与‘码根’,也就是把分子与原子混为一谈,需要进行大量的记忆和背诵。以五笔字型为例,它的出发点是汉字,而不是构成汉字的原子,死记的东西太多,而其他码,则恨不得把所有的键都用上,甚至连数字键和符号键也都用上,这些键离手指太远,严重影响速度,由于大量借用了数字键和符号键,它们大多是失败的产品。而码根码则完全不同,它的规则十分简单,需要死记硬背的只有 20 多个。”

1998 年初,码根码通过了中国电子技术标准信息化研究所中文信息处理产品标准,各项标准全部达标。有关方面认为,码根码完全符合国家信息处理规范。

一、码根码选取的构字部件分别选自标准部件(73.8%),自定认部件

(26.2%);二、它能正确输入 GB13000.1 中的所有汉字和各种符号;三、汉字拆分原则符合《信息处理用 GB13000.1 字符集汉字部首规范》中的有关规定,重码率仅为 9%。如今,使用码根码可以达到每分钟 70 个以上的汉字录入速度,但最快速度目前还没有测试过。目前,码根码主要分为 GBK 码根码和普通码根码两种。普通码根码字库包含 6763 个简体汉字编码,GBK 码根码则包含 20902 个汉字编码,其中,GB 表示标准,K 表示扩展,即全面支持Windows95/98,但不支持 Windows3.1/3.2。GBK 不仅包含了普通码根码中的所有汉字编码,还包括了中、日、韩三国的几乎所有常用字和常用符号,但由于各种原因尚未正式上市。