五笔字型编码法

对于从未学过五笔字型的人士,我们建议最好“一步到位”直接学习新世纪版五笔字型,因为新世纪版(第三代)是五笔字型编码技术的“终极版”,其中的字根和字根键位以后不再改动了。

对于原来已学会86版、98版的人士,只要仔细看一看第三章第六节(前页)的新世纪版与86版字根变动表,也不难自然而然地过度到新世纪版。原因是,新世纪版完全符合规范、更加好记好用,三个版本的字、词“取码法”及识别码,也都是相同的。

引用 http://www.wangma.com.cn/WBD2008/UserManual/5.html

一些人士认为五笔字型“难学”,这是缺乏分析的。

学习起来并不难。只要按规律记住25个字母键上的125种字根,即字根键位图(可以背一背助记歌帮助记忆),再按照编码流程图所示的规则拆字和取码,就能很快学会。

其实,用五笔字型打字,就等于在键盘上用“字根”写字,只不过是按一下键,就等于“写了一个字根”罢了。只要会写字,一两天学会编码并不难,真正难的是打字速度!因为多数中国人没有从小练好英文打字指法,十个指头不听话,年龄越大,越不听话!怎能打字?但只要方法得当又常加练习,每分钟输入50~80个字是不难的。

学一阵子,用一辈子!

上一章掌握了字根所在的区和键位,下面学习拆字和取码法。

 

第一节 编码流程图

五笔字型将成千上万个汉字首先分成两大类:键面上有的“键面字”和键面上没有的“键外字”。两类汉字的取码法按以下流程图分别取码。

第二节 键面字的编码输入法

五笔字型字根键盘上,本身是汉字的字根,叫“键面字”。“键面字”分为三类,其输入法分别是:

1、键名字的输入

每一个键位上,最左上角的那个黑体字的码元,叫键名字,它是“一键之名”。以G键为例,其左上角的字根“王”便是“键名字”或“键名”。

键名字“王”;

 

键名字“言”。

“键名字”的输入法是:把所在的键连打4下。例如:

1区1位键名:王 11 11 11 11 (GGGG)

3区2位键名:白 32 32 32 32 (RRRR)

4区5位键名:之 45 45 45 45 (PPPP)

5区3位键名:女 53 53 53 53 (VVVV)

在王码五笔字型中,键名码元有25个。

1区:王土大木工(对应键位:GFDSA)

2区:目日口田山(对应键位:HJKLM)

3区:禾白月人金(对应键位:TREWQ)

4区:言立水火之(对应键位:YUIOP)

5区:已子女又纟(对应键位:NBVCX)

2、成字字根的输入

键面上除键名外,凡本身是汉字的码元,叫“成字字根”或“成字码元”。其输入法是:先打一下它所在的键(这一下俗称“报户口”),再打第一个、第二个,以及它的最末一个单笔画,最多4下,不足4下,补一个空格键。例如:

当输入十、七、九、二、几、儿、乃、刀……这一类只有2个笔画的字根时,“报户口”之后就只能有两个笔画了,不足4个码,笔画打完,要再补打一下“空格键”表示结束。

3、补码码元及其输入

在字根表中,用方圆框“框住”的 、 、 、(只用于繁体字)共4个字根,是“补码码元”,它们作为字根参与编码时,像姓氏中的复姓诸葛、司马一样,要编2个码:“主码(即码元所在键位)+补码(规定取该码元最后的笔画结构)”。如下表所示:

注 :表中带圆圈的笔画  、  等,是“补码”的笔画表示形式,作为一个符号,用以提示编码。

这4个补码码元中的“犭、礻、衤”等三个字根,本身也是汉字,这三个汉字的编码规则是,要先“报户口”(主码+补码)(已占用2个码)、再打该字的第1笔和最后1笔,共取4码。即:

不难发现,并不是键位上所有的字根都可以“打出来”!如“11”和补码码元“”等,那是因为这些字根本身并不是汉字。

提示:“补码码元”的设计,完全是为了保证键面字根的完整性和部件规范。其实,它们的编码效果和86版完全一样,只是换了个“说法”罢了!也就是说,对于,你就当作是86版的“”和“”仍然在Q和P键上,仍然按86版的犭=丿、礻=丶、衤=冫编码输入,效果完全一样!

 

第三节 “键外字”的拆分法

本节是学习五笔字型的重点内容。

凡是“字根总表”上没有的汉字,都是“键外字”。它们都是由几个码元(字根)组合而成的,我们也把这类字称为“多元字”。

对于“多元字”,我们的办法,只有一个字——拆!

我们必须把由若干个字根构成的字,都“拆”成为一串字根表上列有的“字根”!怎么“拆”呢?必须按照一定的规则“拆”。科学、实用又没有“二义性”的“拆”法,共有以下5项规则(参见本章第一节“编码流程图”):

1、书写顺序

“合体字”拆成“字根”,一般情况下,要按照正确书写顺序进行。

例如:

新:立 木 斤(顺序正确)

立 斤 木(顺序错误)

2、取大优先

要“拆”出“笔画尽可能多”的“字根”。要以“再添一个笔画,便不能构成为笔画更多的字根”为限度!例如:

失:  人(正确,再添一笔, 就不是字根了)

 大(错误,再添一笔成为“”,比“”要大)

估:亻 古 (正确)

亻 十 口(错误,因为“口”可添到前面的“十”上,“凑”成更多笔画的字根“古”)

注:“取大优先”,俗称“尽量往前凑”。因为“向前凑”总是有限度的,要凑成字根表中笔画更多(更大)的一个!否则,便没有“章法”了,势必有许多种“拆法”甚至都要拆成单笔画!在汉字拆分中,这是一个最常用到的、保证拆分唯一性的基本原则。

3、兼顾直观

在编码时,为了使码元特征明显易辨,有时就要暂时牺牲“书写顺序”和“取大优先”的原则,形成个别例外的情况。

例:“国”字

按“书写顺序”,其码元应是:“冂王丶一”,但这样编码,不但有悖于该字的字源,也不能使码元“囗”直观易辨。我们只好违背“书写顺序”,按“囗王丶”的顺序编码。同样的例子又如:

自:丿 目 (正确,但并没有“取大优先”)

亻  三 (错误,虽按“取大优先”拆分了,但不直观,有悖于字源)

注:“自”是一个指事字,上面是一个手指,下面的“目”原本是鼻子的象形,意即用指头指着鼻子代表“自己”。

4、能连不交

请看以下取码实例:

天:一 大 (正确,“一”与“大”是相连接的关系,比较直观)

二 人 (错误,“二”与“人”交叉在一起了)

生:丿  (正确,“丿”与“”是相连的,直观可取)

 土 (错误,“丿”与“”是相连的,直观可取)

一般来说,“连”比“交”更为“直观”,更能显现码元的笔画结构特征,更易于辨认。

5、能散不连

有时候,一个汉字的几个码元,都不是单笔画,这些码元之间的关系,常常在“散”和“连”之间模棱两可。

如:

占:  口,两个码元按“连”处理,便是杂合型(3型)字,如按“散”处理,便是上下型(2型)字。

矢:  大,两个码元按“连”处理,“矢”便是杂合型(3型)字;两个码元如果按“散”处理,“矢”便是上下型(2型)字。

又如:羊:  、 (两个字根,可视为散,也可当作连)

午: 、十(两个字根,可视为散,也可当作连)

都是既可“连”,又可“散”的关系。

当遇到这种既能“散”,又能“连”的情况时,我们规定:只要不是单笔画,一律按“能散不连”判别,即优先确定为“散”的关系。

由此可见,以上两例中的“占”和“矢”,都被认为是“上下型”,即作为2型字(这样规定,仅仅是为取码的严密性设计,并不影响你的书写习惯和汉字结构!)。

 

第四节 四元字及多元字的取码法

一、“四元字”的编码规则

键外字中的“四元字”,是指刚好由四个字根构成的字。其拆分之后的取码方法是“依照书写顺序输入字根”。例如:

 

照:
22 53 23 44
J V K O
低:
34 35 15 41
W Q A Y
重: 丿
31 11 22 12
T G J F
事:
11 23 53 21
G K V H

 

二、“多元字”的取码规则 —— “前三末一”(一二三末)

键外字中的“多元字”,是指由4个以上的字根构成的字。这种字,不管实际上能“拆”成几个字根,我们只需“按书写顺序,取拆分结果的第一 二 三及最末一个字根”便可,俗称“一二三末”,共输入四个码。例如:

 

暨:
53 54 15 11
V C A G
攀:
14 32 32 32
S R R R

 

 

第五节 末笔字型识别码

汉字编码输入法的设计,要尽量减少重码,以提高输入的唯一性。但从以下两种情形我们看到,仅仅输入字根,很容易产生重码:

(1)、因构字的字根相同,字型不同引起重码:

叭:口 八(23 34 KW)

只:口 八(23 34 KW)

这个例子说明,编码中丢失了字型信息,才产生了重码。

(2)、因几个字根同一键位引起重码:

沐:氵 木(43 14 IS)

汀:氵 丁(43 14 IS)

洒:氵 西(43 14 IS)

这个例子说明,编码没有将“木、丁、西”加以区分,才产生了重码。

由以上两类例子可知,当遇到2-3个字根构成的汉字时,为了避免编码相同(重码),既有必要提取“字型信息”,又有必要从字根上“提取笔画特征信息”用于编码。复合这两种信息的一个附加码,就是“末笔字型识别码”简称“识别码”,“识别码”只追加在由2-3个字根构成的汉字编码中(见下节)。

“识别码”是由“末笔”代号加“字型”代号构成的一个“复合附加码”。1、2、3型汉字的识别码共有15个(各有3种形式),其构成如下:

例:
红:末笔1,字型1,
识别码为11(即);
华:末笔2,字型2,
识别码为22(即);
团:末笔3,字型3,
识别码为33(即)。

 

 

第六节 二元字及三元字的取码法

“键外字”中,只有2个字根的字,叫“二元字”;只有3个字根的字,叫“三元字”。输入时,键外字毫无例外地都要“拆”!

“二元字”或“三元字”的输入法是:

先“拆”成字根,输入字根后,再追加一个“末笔字型识别码”(简称“识别码”)。有了识别码可以大量减少重码。

“识别码”的简易直观表示法——用带圆圈的笔画表示“识别码”:

1、左右型(1型)字的“识别码”

对于1型(左右型)字,字根输入之后,补打“1个末笔画”,就等同于添加了“识别码”,用表示之。例如:

 

红: (字根打完,补打1个末笔画“一”,相当于11?G)
55 15 11
X A G
形: (字根打完,补打1个末笔画“丿”,相当于31?T)
11 15 33 31
G A E T

 

2、上下型(2型)字的“识别码

对于2型(上下型)字,码元输入之后,补打“2个末笔画”的字根,就等同于添加了“识别码”,用表示之。例如:

 

字: (字根打完,补打2个末笔画“二”,相当于12?F)
45 52 12
P B F
复: (字根打完,补打2个末笔画“”,相当于42?U)
31 22 31 42
T J T U
花: (字根打完,补打2个末笔画“巜”,相当于52?B)
15 34 55 52
A W X B

 

3、杂合型(3型)字的“识别码”

对于3型(杂合型)字,码元输完之后,补打“3个末笔画”的字根,就等同于添加了“识别码”,用表示之。例如:

 

同: (字根打完,补打3个末笔画“三”,相当于13?D)
25 11 23 13
M G K D
远: (字根打完,补打3个末笔画“巛”,相当于53?V)
12 35 45 53
F Q P V
局: (字根打完,补打3个末笔画“三”,相当于13?D)
51 51 23 13
N N K D
朱: (字根打完,补打3个点的末笔画如“氵”,相当于43?I)
32 43 43
R I I

 

注1:凡是“包围型”的字,如全包围字“国、团”等,半包围字“这、庆”等,均以被包围的那个部分的“末笔”作为整个字的“末笔”来构成“识别码”,如“远”字,要以被包围的“儿”的末笔来构成“识别码”(53?V)。

注2:识别码一共有3种表示法,其编码的效果完全相同,都是同一个码!可以按照下面的方法打“识别码”,例如:

末笔横的1型字:打11键,就是G键,就是(一个横)键!

末笔撇的3型字:打33键,就是E键,就是(三个撇)键!

其所以如此,道理很简单:1区1位(G)上有1个横,3区3位(E)上有3个撇……

 

第七节 简码和容错码输入

一、简码输入

一些常用的字,除按它的“全码”可输入外,为减少打键次数,只输入其全码的最前边的1个、2个或3个码,再加打空格键,也可以输入,这就是一、二、三级简码。简码可以提高输入效率。

“简码”正如人的名字,比如名字“赵丽梅”,就是“全码”,“二级简码”——丽梅,最亲近的人则叫“一级简码”——梅。

1、一级简码(又称“高频字”)

将字母键打一下,再打一下空格键,即可打出25个最常用的汉字如下表:

2、二级简码(只输入“全码”的前2个码)

化:亻 匕(34 55 WX)

李:木 子(14 52 SB)

理论上,二级简码共有25×25=625个,可参见附录二级简码表。

3、三级简码(只输入“全码”的前3个码)

想:木 目 心(14 21 51 SHN)

巍:山 禾 女 (25 31 53 MTV)

三级简码的数量比较多,理论上有25×25×25=15625个,实际上有许多“空位”,这里不再列出。但输入软件对三级简码是作了标示的。在输入过程中会发现,“提示框”中有些字的后面带个“*”号,就说明这样的字是简码字。

如:输入“将”,当输入前三个编码“uqf”后,我们看到“将”的后面有“*”号,这就是告诉我们“将”字是有“三级简码”的,此时,不必打最后一个字根,只要按一下空格键,“将”字上屏。

注:上图中,“将”的后面还有一个字母“Y”,那是提示,还剩下一个编码“Y”没有输入,在有“*”号的情况下,Y就不必输入,直接打空格键,三级简码字就可以上屏了。

有些字因为很常用,它可能有一级简码,也可能同时还有二级简码和三级简码。如“经”字,就有一、二、三级简码。

经:X (加空格)

经:X C (加空格)

经:X C G(加空格)

二、容错码

“容错码”的涵义是:“容易”编错,但“容许”按错码输入。例如:

 

面: DMJD (正确,按笔顺取大优先)
DMJF (拆分容错)
左: DAF (正确,视为上下型)
DAD (字型容错)

 

如果按“容错码”输入,大一统软件会自动提示出正确的编码。例如对于“左”字输入“DAD”,在提示框中,会提示“左”的正确编码“DAF”,及正确的字根分解“工”(是末笔为“一”的2型字的“识别码”)。

万能键Z

输入汉字时,如果一时不知道某些字的编码,便可以用“万能键Z”来代替“不知道的那个码”。Z键的用途主要可分以下三种情况:

1.当不知道某个字的拆分时,用Z代替不知道的字根,例:

键:钅 Z Z 廴

2.当不知道字根在哪个键位上时,用Z代替,例:

论:讠 人 Z Z

3.当不知道字的“识别码”时,可用Z代替,例:

花:艹 亻 匕 Z

万能键Z也叫学习键。一旦使用Z键,提示行中便会有比较多的字显示出来,其中会有你要的那个字,而且,字的后边还有正确码的提示。

当然,用Z键越多,提示行的字也就越多。如果你打了4个“Z”,那提示就把全部汉字都显示一遍——因为你没有告诉电脑,你要的那个字有什么特征。

 

第八节 词汇输入

在字母键上,打4个键,不用换档,既能打单字,又能打词汇,字、词之间没有界限,这是发明人1983年的一项重大创造——字词兼容。

在输入词汇时,不管多长的词汇,一律只打4下键,单字和词汇可以混合输入,字词之间不用任何换档或其它附加操作。词汇输入法为:

一、2字词

取每个字“全码”的前两个码组成,共4码。例如:

例如:

 

经济:
55 54 43 41 (XCIY)
建设:
53 12 41 34 (VGYW)

 

二、3字词

前两个字,各取第一个码,最后一字取前两个码,共4码。例如:

例如:

 

电视机:
22 45 14 25 (JPSW)
新加坡:
42 33 12 21 (UEFH)

 

三、4字以上的词

对于4个字或超过4个字的词,取第一、二、三及最后一个汉字的第一码,共4码。例如:

 

科学技术:
31 43 32 14 (TIRS)
常务委员会:
43 31 31 34 (ITTW)
中华人民共和国:
23 34 34 24 (KWWL)