五笔字型编码法

对于从未学过五笔字型的人士，我们建议最好“一步到位”直接学习新世纪版五笔字型，因为新世纪版（第三代）是五笔字型编码技术的“终极版”，其中的字根和字根键位以后不再改动了。

对于原来已学会86版、98版的人士，只要仔细看一看第三章第六节（前页）的新世纪版与86版字根变动表，也不难自然而然地过度到新世纪版。原因是，新世纪版完全符合规范、更加好记好用，三个版本的字、词“取码法”及识别码，也都是相同的。

引用 http://www.wangma.com.cn/WBD2008/UserManual/5.html

一些人士认为五笔字型“难学”，这是缺乏分析的。

学习起来并不难。只要按规律记住25个字母键上的125种字根，即字根键位图（可以背一背助记歌帮助记忆），再按照编码流程图所示的规则拆字和取码，就能很快学会。

其实，用五笔字型打字，就等于在键盘上用“字根”写字，只不过是按一下键，就等于“写了一个字根”罢了。只要会写字，一两天学会编码并不难，真正难的是打字速度！因为多数中国人没有从小练好英文打字指法，十个指头不听话，年龄越大，越不听话！怎能打字？但只要方法得当又常加练习，每分钟输入50～80个字是不难的。

学一阵子，用一辈子！

上一章掌握了字根所在的区和键位，下面学习拆字和取码法。

第一节编码流程图

五笔字型将成千上万个汉字首先分成两大类：键面上有的“键面字”和键面上没有的“键外字”。两类汉字的取码法按以下流程图分别取码。

第二节键面字的编码输入法

五笔字型字根键盘上，本身是汉字的字根，叫“键面字”。“键面字”分为三类，其输入法分别是：

1、键名字的输入

每一个键位上，最左上角的那个黑体字的码元，叫键名字，它是“一键之名”。以G键为例，其左上角的字根“王”便是“键名字”或“键名”。

键名字“王”；

键名字“言”。

“键名字”的输入法是：把所在的键连打4下。例如：

1区1位键名：王 11 11 11 11 （GGGG）

3区2位键名：白 32 32 32 32 （RRRR）

4区5位键名：之 45 45 45 45 （PPPP）

5区3位键名：女 53 53 53 53 （VVVV）

在王码五笔字型中，键名码元有25个。

1区：王土大木工（对应键位：GFDSA）

2区：目日口田山（对应键位：HJKLM）

3区：禾白月人金（对应键位：TREWQ）

4区：言立水火之（对应键位：YUIOP）

5区：已子女又纟（对应键位：NBVCX）

2、成字字根的输入

键面上除键名外，凡本身是汉字的码元，叫“成字字根”或“成字码元”。其输入法是：先打一下它所在的键（这一下俗称“报户口”），再打第一个、第二个，以及它的最末一个单笔画，最多4下，不足4下，补一个空格键。例如：

当输入十、七、九、二、几、儿、乃、刀……这一类只有2个笔画的字根时，“报户口”之后就只能有两个笔画了，不足4个码，笔画打完，要再补打一下“空格键”表示结束。

3、补码码元及其输入

在字根表中，用方圆框“框住”的、、、(只用于繁体字)共4个字根，是“补码码元”，它们作为字根参与编码时，像姓氏中的复姓诸葛、司马一样，要编2个码：“主码（即码元所在键位）+补码（规定取该码元最后的笔画结构）”。如下表所示：

注：表中带圆圈的笔画、等，是“补码”的笔画表示形式，作为一个符号，用以提示编码。

这4个补码码元中的“犭、礻、衤”等三个字根，本身也是汉字，这三个汉字的编码规则是，要先“报户口”（主码+补码）（已占用2个码）、再打该字的第1笔和最后1笔，共取4码。即：

不难发现，并不是键位上所有的字根都可以“打出来”！如“11”和补码码元“”等，那是因为这些字根本身并不是汉字。

提示：“补码码元”的设计，完全是为了保证键面字根的完整性和部件规范。其实，它们的编码效果和86版完全一样，只是换了个“说法”罢了！也就是说，对于，你就当作是86版的“”和“”仍然在Q和P键上，仍然按86版的犭=丿、礻=丶、衤=冫编码输入，效果完全一样！

第三节 “键外字”的拆分法

本节是学习五笔字型的重点内容。

凡是“字根总表”上没有的汉字，都是“键外字”。它们都是由几个码元（字根）组合而成的，我们也把这类字称为“多元字”。

对于“多元字”，我们的办法，只有一个字——拆！

我们必须把由若干个字根构成的字，都“拆”成为一串字根表上列有的“字根”！怎么“拆”呢？必须按照一定的规则“拆”。科学、实用又没有“二义性”的“拆”法，共有以下5项规则（参见本章第一节“编码流程图”）：

1、书写顺序

“合体字”拆成“字根”，一般情况下，要按照正确书写顺序进行。

例如：

新：立木斤（顺序正确）

立斤木（顺序错误）

2、取大优先

要“拆”出“笔画尽可能多”的“字根”。要以“再添一个笔画，便不能构成为笔画更多的字根”为限度！例如：

失：人（正确，再添一笔，就不是字根了）

大（错误，再添一笔成为“”，比“”要大）

估：亻古（正确）

亻十口（错误，因为“口”可添到前面的“十”上，“凑”成更多笔画的字根“古”）

注：“取大优先”，俗称“尽量往前凑”。因为“向前凑”总是有限度的，要凑成字根表中笔画更多（更大）的一个！否则，便没有“章法”了，势必有许多种“拆法”甚至都要拆成单笔画！在汉字拆分中，这是一个最常用到的、保证拆分唯一性的基本原则。

3、兼顾直观

在编码时，为了使码元特征明显易辨，有时就要暂时牺牲“书写顺序”和“取大优先”的原则，形成个别例外的情况。

例：“国”字

按“书写顺序”，其码元应是：“冂王丶一”，但这样编码，不但有悖于该字的字源，也不能使码元“囗”直观易辨。我们只好违背“书写顺序”，按“囗王丶”的顺序编码。同样的例子又如：

自：丿目（正确，但并没有“取大优先”）

亻三（错误，虽按“取大优先”拆分了，但不直观，有悖于字源）

注：“自”是一个指事字，上面是一个手指，下面的“目”原本是鼻子的象形，意即用指头指着鼻子代表“自己”。

4、能连不交

请看以下取码实例：

天：一大（正确，“一”与“大”是相连接的关系，比较直观）

二人（错误，“二”与“人”交叉在一起了）

生：丿（正确，“丿”与“”是相连的，直观可取）

土（错误，“丿”与“”是相连的，直观可取）

一般来说，“连”比“交”更为“直观”，更能显现码元的笔画结构特征，更易于辨认。

5、能散不连

有时候，一个汉字的几个码元，都不是单笔画，这些码元之间的关系，常常在“散”和“连”之间模棱两可。

如：

占：口，两个码元按“连”处理，便是杂合型（3型）字，如按“散”处理，便是上下型（2型）字。

矢：大，两个码元按“连”处理，“矢”便是杂合型（3型）字；两个码元如果按“散”处理，“矢”便是上下型（2型）字。

又如：羊：、（两个字根，可视为散，也可当作连）

午：、十（两个字根，可视为散，也可当作连）

都是既可“连”，又可“散”的关系。

当遇到这种既能“散”，又能“连”的情况时，我们规定：只要不是单笔画，一律按“能散不连”判别，即优先确定为“散”的关系。

由此可见，以上两例中的“占”和“矢”，都被认为是“上下型”，即作为2型字（这样规定，仅仅是为取码的严密性设计，并不影响你的书写习惯和汉字结构！）。

第四节四元字及多元字的取码法

一、“四元字”的编码规则

键外字中的“四元字”，是指刚好由四个字根构成的字。其拆分之后的取码方法是“依照书写顺序输入字根”。例如：

照：	日	刀	口	灬
	22	53	23	44
	J	V	K	O

低：	亻			丶
	34	35	15	41
	W	Q	A	Y

重：	丿	一	日	土
	31	11	22	12
	T	G	J	F

事：	一	口	彐	亅
	11	23	53	21
	G	K	V	H

二、“多元字”的取码规则 —— “前三末一”（一二三末）

键外字中的“多元字”，是指由4个以上的字根构成的字。这种字，不管实际上能“拆”成几个字根，我们只需“按书写顺序，取拆分结果的第一二三及最末一个字根”便可，俗称“一二三末”，共输入四个码。例如：

暨：	彐	厶	匚	儿	日	一
	53	54	15			11
	V	C	A			G

攀：	木	乂	乂	木	大	手
	14	32	32			32
	S	R	R			R

第五节末笔字型识别码

汉字编码输入法的设计，要尽量减少重码，以提高输入的唯一性。但从以下两种情形我们看到，仅仅输入字根，很容易产生重码：

(1)、因构字的字根相同，字型不同引起重码：

叭：口八（23 34 KW）

只：口八（23 34 KW）

这个例子说明，编码中丢失了字型信息，才产生了重码。

(2)、因几个字根同一键位引起重码：

沐：氵木（43 14 IS）

汀：氵丁（43 14 IS）

洒：氵西（43 14 IS）

这个例子说明，编码没有将“木、丁、西”加以区分，才产生了重码。

由以上两类例子可知，当遇到2-3个字根构成的汉字时，为了避免编码相同（重码），既有必要提取“字型信息”，又有必要从字根上“提取笔画特征信息”用于编码。复合这两种信息的一个附加码，就是“末笔字型识别码”简称“识别码”，“识别码”只追加在由2-3个字根构成的汉字编码中（见下节）。

“识别码”是由“末笔”代号加“字型”代号构成的一个“复合附加码”。1、2、3型汉字的识别码共有15个（各有3种形式），其构成如下：

例：
红：末笔1，字型1，
	识别码为11（即）；
华：末笔2，字型2，
	识别码为22（即）；
团：末笔3，字型3，
	识别码为33（即）。

第六节二元字及三元字的取码法

“键外字”中，只有2个字根的字，叫“二元字”；只有3个字根的字，叫“三元字”。输入时，键外字毫无例外地都要“拆”！

“二元字”或“三元字”的输入法是：

先“拆”成字根，输入字根后，再追加一个“末笔字型识别码”（简称“识别码”）。有了识别码可以大量减少重码。

“识别码”的简易直观表示法——用带圆圈的笔画表示“识别码”：

1、左右型（1型）字的“识别码”

对于1型（左右型）字，字根输入之后，补打“1个末笔画”，就等同于添加了“识别码”，用表示之。例如：

红：	纟	工		(字根打完，补打1个末笔画“一”，相当于11?G)
	55	15	11
	X	A	G

形：	一				(字根打完，补打1个末笔画“丿”，相当于31?T)
	11	15	33	31
	G	A	E	T

2、上下型（2型）字的“识别码

对于2型（上下型）字，码元输入之后，补打“2个末笔画”的字根，就等同于添加了“识别码”，用表示之。例如：

字：	宀	子		(字根打完，补打2个末笔画“二”，相当于12?F)
	45	52	12
	P	B	F

复：		日	夂		(字根打完，补打2个末笔画“”，相当于42?U)
	31	22	31	42
	T	J	T	U

花：	艹	亻	匕		(字根打完，补打2个末笔画“巜”，相当于52?B)
	15	34	55	52
	A	W	X	B

3、杂合型（3型）字的“识别码”

对于3型（杂合型）字，码元输完之后，补打“3个末笔画”的字根，就等同于添加了“识别码”，用表示之。例如：

同：	冂	一	口		(字根打完，补打3个末笔画“三”，相当于13?D)
	25	11	23	13
	M	G	K	D

远：	二	儿	辶		(字根打完，补打3个末笔画“巛”，相当于53?V)
	12	35	45	53
	F	Q	P	V

局：	尸		口		(字根打完，补打3个末笔画“三”，相当于13?D)
	51	51	23	13
	N	N	K	D

朱：		小		(字根打完，补打3个点的末笔画如“氵”，相当于43?I)
	32	43	43
	R	I	I

注1：凡是“包围型”的字，如全包围字“国、团”等，半包围字“这、庆”等，均以被包围的那个部分的“末笔”作为整个字的“末笔”来构成“识别码”，如“远”字，要以被包围的“儿”的末笔来构成“识别码”（53?V）。

注2：识别码一共有3种表示法，其编码的效果完全相同，都是同一个码！可以按照下面的方法打“识别码”，例如：

末笔横的1型字：打11键，就是G键，就是（一个横）键！

末笔撇的3型字：打33键，就是E键，就是（三个撇）键！

其所以如此，道理很简单：1区1位（G）上有1个横，3区3位（E）上有3个撇……

第七节简码和容错码输入

一、简码输入

一些常用的字，除按它的“全码”可输入外，为减少打键次数，只输入其全码的最前边的1个、2个或3个码，再加打空格键，也可以输入，这就是一、二、三级简码。简码可以提高输入效率。

“简码”正如人的名字，比如名字“赵丽梅”，就是“全码”，“二级简码”——丽梅，最亲近的人则叫“一级简码”——梅。

1、一级简码（又称“高频字”）

将字母键打一下，再打一下空格键，即可打出25个最常用的汉字如下表：

2、二级简码（只输入“全码”的前2个码）

化：亻匕（34 55 WX）

李：木子（14 52 SB）

理论上，二级简码共有25×25=625个，可参见附录二级简码表。

3、三级简码（只输入“全码”的前3个码）

想：木目心（14 21 51 SHN）

巍：山禾女 (25 31 53 MTV)

三级简码的数量比较多，理论上有25×25×25=15625个，实际上有许多“空位”，这里不再列出。但输入软件对三级简码是作了标示的。在输入过程中会发现，“提示框”中有些字的后面带个“*”号，就说明这样的字是简码字。

如：输入“将”，当输入前三个编码“uqf”后，我们看到“将”的后面有“*”号，这就是告诉我们“将”字是有“三级简码”的，此时，不必打最后一个字根，只要按一下空格键，“将”字上屏。

注：上图中，“将”的后面还有一个字母“Y”，那是提示，还剩下一个编码“Y”没有输入，在有“*”号的情况下，Y就不必输入，直接打空格键，三级简码字就可以上屏了。

有些字因为很常用，它可能有一级简码，也可能同时还有二级简码和三级简码。如“经”字，就有一、二、三级简码。

经：X （加空格）

经：X C （加空格）

经：X C G（加空格）

二、容错码

“容错码”的涵义是：“容易”编错，但“容许”按错码输入。例如：

面：	丆	冂	三	DMJD	（正确，按笔顺取大优先）
	丆	囗	二	DMJF	（拆分容错）

左：		工		DAF	（正确，视为上下型）
		工		DAD	（字型容错）

如果按“容错码”输入，大一统软件会自动提示出正确的编码。例如对于“左”字输入“DAD”，在提示框中，会提示“左”的正确编码“DAF”,及正确的字根分解“工”（是末笔为“一”的2型字的“识别码”）。

万能键Z

输入汉字时，如果一时不知道某些字的编码，便可以用“万能键Z”来代替“不知道的那个码”。Z键的用途主要可分以下三种情况：

1．当不知道某个字的拆分时，用Z代替不知道的字根，例：

键：钅 Z Z 廴

2．当不知道字根在哪个键位上时，用Z代替，例：

论：讠人 Z Z

3．当不知道字的“识别码”时，可用Z代替，例：

花：艹亻匕 Z

万能键Z也叫学习键。一旦使用Z键，提示行中便会有比较多的字显示出来，其中会有你要的那个字，而且，字的后边还有正确码的提示。

当然，用Z键越多，提示行的字也就越多。如果你打了4个“Z”，那提示就把全部汉字都显示一遍——因为你没有告诉电脑，你要的那个字有什么特征。

第八节词汇输入

在字母键上，打4个键，不用换档，既能打单字，又能打词汇，字、词之间没有界限，这是发明人1983年的一项重大创造——字词兼容。

在输入词汇时，不管多长的词汇，一律只打4下键，单字和词汇可以混合输入，字词之间不用任何换档或其它附加操作。词汇输入法为：

一、2字词

取每个字“全码”的前两个码组成，共4码。例如：

例如：

经济：	纟		氵	文
	55	54	43	41	（XCIY）

建设：	彐		讠	几
	53	12	41	34	（VGYW）

二、3字词

前两个字，各取第一个码，最后一字取前两个码，共4码。例如：

例如:

电视机：	日	礻	木	几
	22	45	14	25	（JPSW）

新加坡：	立	力	土
	42	33	12	21	（UEFH）

三、4字以上的词

对于4个字或超过4个字的词，取第一、二、三及最后一个汉字的第一码，共4码。例如：

科学技术：	禾		扌	木
	31	43	32	14	（TIRS）

常务委员会：	⺌	夂	禾	人
	43	31	31	34	（ITTW）

中华人民共和国：	口	亻	人	囗
	23	34	34	24	（KWWL）