(三)五笔字型输入法

五笔字型输入法是当前流行的汉字输入方法。它几乎没有重码,是目前国内外最快的汉字输入法之一。

五笔字型输入法的基本思想是将汉字分为笔划、字根、整字三个层次。笔划的组合产生字根,字根拼形产生汉字;按传统习惯排列笔划,依笔划排列字根;按汉字习惯书写顺序,以字根为基本单位,组成编码,拼形输入。

  1. 汉字字根的分类及其在键盘上的分布

由若干笔划交叉连接而形成的相对不变的结构称为字根,对那些组字能力很强且在日常汉字中出现次数很多的字根称作“基本字根”,这些“基本字根”被认作是组成汉字的基本单位,一般来说,每一个汉字都可以按汉字的“拆分原则”拆分成若干个字根,然后以字根为单位进行编码通过键盘输入。

五笔字型输入法把汉字字根基本上接起始笔划分为五类,即:横起类、竖起类、撇起类、捺起类和折起类(所谓横起类的字根即以一横开头的字根,

余此类推)。每一类对应英文键盘上的一个区(含五个键),每区又分作五个位(每位对应一个键)。字根和键盘的对应关系如“五笔字型键盘字根总图”所示。

本身就能自成一个汉字的字根称为成字字根,在成字字根中以一个最常用的作为该键的“代表”,称为“键名”。各键的键名、代码及基本字根等如“五笔字型基本字根总表”所示。

以同一区号同一位号落在同一键上的一组字根,一般具有一些共同特点:

①与键名字根形态相近。如:“王”字键上有“主”、“五”等字根; “已”字键上有“已”巳”字根。

②字根的首笔代码与其所在区号一致,相当部分字根第二笔的代码与键位号一致。如“大”、“石”、“厂”、“犬”等字根的第一笔是“横”, 其代号为 1,与区号 1 一致;而第二笔为“撇”,其代号为 3,与位号 3 相一致。

③字根的区位代码还表示了组成字根的单笔划的种类和数量。如一个点

(或捺)的字根“、”落在 4 区 1 位;两个点的字根落在 4 区 2 位;三个点

的字根“氵”落在 4 区 3 位等等。2.汉字的基本结构

由基本字根组成的汉字,按照它们之间的相互位置关系,可把汉字的结构分成 4 种类型:单、散、连、交。

①单的结构。单的结构表示字根本身就能单独构成一个汉字。前面介绍过的键名汉字和成字字根字就属于这一类型。

如:王、土、工、言、立、口、田、已、女、又⋯ 干、广、厂、由、马、七、八、九、古、西⋯

②散的结构。散的结构表示在构成汉字的基本字根之间,可以保持一定距离的汉字结构。在这结构中,字根之间的相互位置有左右、上下和杂合三种类型。这就是汉字的三种基本结构类型,汉字的这三种结构,即左右型结构、上下型结构和杂合型结构分别以代码 1,2,3,表示,可作为汉字输入信息之一。

③连的结构。连的结构表示一个基本字根与一个单笔相连汉字结构。 这种汉字结构的单笔划与基本字根相连,不相交也不分离,用几何的术

语来说是相切的关系。

另外,还有一种所谓“带点结构”也归属于连的结构,这种结构由一个单笔划点(、)和一个基本字根组成,它们之间的位置可近可远,可连可不连,也归属于连的结构。如:

不(一小)

太(大、)主(、王) 连的结构字型代码为 3。

④交的结构。交的结构是指组成汉字的几个字根相互交叉套叠构成的汉字结构。

如:里(日土)夷(一弓人) 交的结构字型代码为 3。

明白了汉字的基本结构之后,就可以进一步看看如何把一个汉字拆分成若干字根然后进行输入,特别是一个汉字有多种拆法时应如何处理。

3.汉字的拆分原则

总的来说,汉字的拆分原则是:应保证每次拆出的是最大的基本字根, 即一个汉字拆分出来的字根数应尽量的少;在拆出的字根数相同的情况下, “散”比“连”优先,“连”比“交”优先。即

取大优先;能散不连;能散不交;能连不交。4.五笔字型输入法的单字输入规则

五笔字型输入法把汉字分成键名汉字、成字字根和合体字三类,在汉字基本结构中所介绍的“单”的结构就包括有键名汉字和成字字根汉字,而其他三种结构即“散”、“连”、“交”三种结构都是针对合体字而言的。键名汉字、成字字根汉字和合体字分别遵循三种不同的输入规则,但不论是哪一种规则,输入键数均不得超过四键。

①键名汉字的输入。输入键名汉字时,只要把该键名汉字所在键连击四下,即可把该键名汉字输入至编辑位置。

如:输入“王”字,则按键 gggg 输入“目”字,则按键 hhhh

②成字字根汉字输入。在字根总表中,除键名以外,本身即是一个汉字的字根即为成字字根汉字。

成字字根汉字的输入法如下:

A.报户口,即先按该成字字根所在的键一下; B.再打该字根的第一、第二及最末一个单笔划; 便可将所需之成字字根输入至编辑处。

如:输入“西”字,应按:sghg 输入“早”字,应按:jhnh

③合体字输入

一般绝大多数汉字的输入均属合体字输入。除键名汉字及成字字根以外的任何汉字,均可视为由基本字根组成的合体字。

合体字的输入分下面三种情况:

  1. 对于由四个或四个以上字根成的汉字,依书写顺序取其第一、二、三及最后一个字根的代码。

如:给:xwgk 横:samw 输:lwgj 攀:sqqr

  1. 对于少四个字根组成的常用汉字,按序取完所有字根后,再按空格键表示结束。

如:

汉:ic[空格] 字:qb[空格] 合:wgk[空格] 适:tdp[空格]

  1. 对于少于四个字根组成但又不是十分常用的汉字,按序取完所有字根后,应再加输“末笔字型”码。

所谓“末笔字型”码,就是把一个汉字的最后一个笔划作为区码,把汉字的字型码作为位码,组成“末笔字型”码,作为区别简单汉字时信息的补充,以避免重码字的产生。

如输入“回”字,则须输入 lkd,其中 d 就是“末笔字型”码,它代表“回”字的最后一笔是一横,落于 1 区,而字型是属于“散”结构中的杂合型,字型代码 3,落于 3 位,因此“回”字的“末笔字型码为 l3,即对应 d

键。同理,输入“位”字,则须输入 wug,其中 g 就是“末笔字型”码等等。在输入过程中,遇到疑难字,均可用字母键“z”来代替。此时,提示行

会出现多个重码字,利用选字的办法把所需的字调至编辑处即可。

在输入过程中,为了进一步提高速度,可利用简码输入。简码输入可分一级简码、二级简码、三级简码等,简码输入就是说,对于某些汉字,可允许输入汉字的前一个、两个或三个代码再加空格来完成汉字的输入。

一级简码(即高频字):对于除 z 外的各字母键码均可构成一级简码, 如:

工(a)

了(b)

以(c)

在(d)

发(v)

人(w)

经(x)

主(y)

二级简码:

张(xt)

信(wy)

化(wx)

三级简码:

得(tig)

经(xca)

5.五笔字型输入法的词组输入规则

不论是多少个字组成的词组,均按四码输入一个词组。

①两字词:每字取其全码的前两码组成,共四码。

②三字词:前两字各取第一码,最后一字取前两码,共四码。如:

③四字词:每字各取其第一码。

④多字词:取第一、二、三及最后一个汉字的第一码,共四码。