都云作者痴:歪打正着
1992 年,冯天岳 74 岁的母亲突然瘫痪在床,无人照顾。冯天岳是个孝子,万不得已,他请了长假,回到北京。在一套狭小而阴暗的小屋里,他一边照顾母亲的生活,一边读书学习。他想出版他的《斥力在宇宙学中的应用》。他不图出名,更不图赚钱,心里只有一个愿望,如果将来国外科学家取得相同的成果时有一个证据,证明这个成果早在若干年前,中国人已经有人成功了。由于厚厚的书稿全由手抄太费事,当时电脑作为一个新兴产业,正在兴起。他不由耳濡目染,产生了浓厚的兴趣。要想跟时代同步就必须学习电脑。1994 年初,他开始找来几本电脑入门书看。由于打字是学电脑的第一关,他先试着学习打字。当时国内打字都用五笔字型,五笔字型是一种专业输入法,
使用甚为广泛。然而由于年过半百,五笔字型繁琐的字根成了他的拦路虎, 由于打字速度太慢,他的工作进程受到严重影响。他想,要是有一种适合于非专业人士学习、使用的汉字输入法,该有多好!这种汉字输入法既要好掌握又要速度快,按说这样的事应该有人去做,然而不知为什么,一直都没有人去做。既然没有现成的,我自己是不是能搞呢?如果搞成,是不是能增加一些经济收入,使母亲得到更好的照顾呢?是不是能为自己的“斥力”理论的完善带来帮助呢?就是在这种情况下,冯天岳开始了对码根码的研究。
汉字编码一般分为声码、形码和混合码三种,形码指按汉字笔形区的编码,声码指按汉字发音区分的编码,混合码则指同时利用汉字的笔型和发音的编码。虽然冯天岳已经下定了决心,但是究竟搞音码还是形码,他还有些拿不定主意。起初,他的时间都花在音码上,由于音码的种种缺陷,各种试验很快宣告失败。对于这件事,冯天岳有这样一段夫子自道:“音码的主要缺点在于二级字库的重码率太高,达百分之百,虽然一学就会,但操作复杂, 仅光选字就要花费 50%以上的时间,磨刀误了砍柴功。刀再快,磨刀的时间很长,也就失去了实际意义。再有,目前国内的普通话普及程度还远远不够, 就连许多专家和学者,他们的普通话也都不敢恭维:
与‘zh’、‘ch’、‘sh’不分,前后鼻韵母严重混淆⋯⋯这些形形色色的困难都决定了现在的音码根本还没进入成熟时期。”
五笔字型的成功给了冯天岳极大的启迪,要想搞出一套好码,还是要走形码的路子。但是,倘若五笔字型易用不易学,再如法炮制,开发出一种像五笔字型一样拒人于千里之外的汉字输入法,岂不等于“换汤不换药”?那样,无论从技术还是从商业的角度讲,都毫无意义。这时,从事了半辈子的物理学给了他灵感,他首先想到了物质的分子结构。他觉得,如果将每一个汉字都看作一个分子的话,那么必然可以找到一个相当于汉字原子的“码根”,千变万化的汉字正是由这些极为有限的码根组合而成的。为什么不可以把物理学理论移植到汉字编码中呢?既然分子和原子可以解释物理世界的一切现象和原理,那么,它就应当可以解释万物——当然包括汉字编码。偶然的发现使他兴奋得睡不着觉。
理论上的突破是一回事,实际操作又是一回事。起初,他将编码和对应的汉字全都写在卡片上,但这种原始方法的弊病很快就显露出来。由于许多字的编码方法处于摸索阶段,即使仅仅改动编码中的一个字母,也会牵扯到其他成千上万张卡片上的所有编码。比如,原先将“口”用“a”表示,但现在要改为用“b”,这时就必须将所有卡片上的原编码全部改过来。这种困难, 王永民在开发五笔字型时也曾遇到过。冯天岳咬咬牙,必须拥有一台自己的电脑。这个愿望不久实现了,1995 年 5 月,他拥有了一台自己的电脑。虽然此前对电脑了解甚少,但他却很快就运用自如。由于他把电脑用来进行汉字编码而不是编程,所以只用其中的 EXCEL 就足够了,这为他节省了大量时间。电脑使他的工作如虎添翼,他的工作进入了一个突飞猛进的时期,到 1996 年夏,码根码已经进入了收尾阶段。
很久以来,简单易学和重码一直是一对不可调和的矛盾,学习者要么使用一种难学的汉字输入法,要么必须忍受重码耗费时间的无奈。码根码的出现,使这一老大难问题迎刃而解,它的最大优势在于简单易学重码少,通常最多四个键,特别是在即将发布的 GBK 码根码里,更能体现出这些优势。一个已过知天命之年的老人,能够在两年多时间内从门外汉到汉字编码专家,
开发出如此优秀的编码来,在业界绝无仅有。
