对于从未学过五笔字型的人士,我们建议最好“一步到位”直接学习新世纪版五笔字型,因为新世纪版(第三代)是五笔字型编码技术的“终极版”,其中的字根和字根键位以后不再改动了。
对于原来已学会86版、98版的人士,只要仔细看一看第三章第六节(前页)的新世纪版与86版字根变动表,也不难自然而然地过度到新世纪版。原因是,新世纪版完全符合规范、更加好记好用,三个版本的字、词“取码法”及识别码,也都是相同的。
引用 http://www.wangma.com.cn/WBD2008/UserManual/5.html
一些人士认为五笔字型“难学”,这是缺乏分析的。
学习起来并不难。只要按规律记住25个字母键上的125种字根,即字根键位图(可以背一背助记歌帮助记忆),再按照编码流程图所示的规则拆字和取码,就能很快学会。
其实,用五笔字型打字,就等于在键盘上用“字根”写字,只不过是按一下键,就等于“写了一个字根”罢了。只要会写字,一两天学会编码并不难,真正难的是打字速度!因为多数中国人没有从小练好英文打字指法,十个指头不听话,年龄越大,越不听话!怎能打字?但只要方法得当又常加练习,每分钟输入50~80个字是不难的。
学一阵子,用一辈子!
上一章掌握了字根所在的区和键位,下面学习拆字和取码法。
第一节 编码流程图
五笔字型将成千上万个汉字首先分成两大类:键面上有的“键面字”和键面上没有的“键外字”。两类汉字的取码法按以下流程图分别取码。
第二节 键面字的编码输入法
五笔字型字根键盘上,本身是汉字的字根,叫“键面字”。“键面字”分为三类,其输入法分别是:
1、键名字的输入
每一个键位上,最左上角的那个黑体字的码元,叫键名字,它是“一键之名”。以G键为例,其左上角的字根“王”便是“键名字”或“键名”。
键名字“王”;
键名字“言”。
“键名字”的输入法是:把所在的键连打4下。例如:
1区1位键名:王 11 11 11 11 (GGGG)
3区2位键名:白 32 32 32 32 (RRRR)
4区5位键名:之 45 45 45 45 (PPPP)
5区3位键名:女 53 53 53 53 (VVVV)
在王码五笔字型中,键名码元有25个。
1区:王土大木工(对应键位:GFDSA)
2区:目日口田山(对应键位:HJKLM)
3区:禾白月人金(对应键位:TREWQ)
4区:言立水火之(对应键位:YUIOP)
5区:已子女又纟(对应键位:NBVCX)
2、成字字根的输入
键面上除键名外,凡本身是汉字的码元,叫“成字字根”或“成字码元”。其输入法是:先打一下它所在的键(这一下俗称“报户口”),再打第一个、第二个,以及它的最末一个单笔画,最多4下,不足4下,补一个空格键。例如:
当输入十、七、九、二、几、儿、乃、刀……这一类只有2个笔画的字根时,“报户口”之后就只能有两个笔画了,不足4个码,笔画打完,要再补打一下“空格键”表示结束。
3、补码码元及其输入
在字根表中,用方圆框“框住”的 、 、 、(只用于繁体字)共4个字根,是“补码码元”,它们作为字根参与编码时,像姓氏中的复姓诸葛、司马一样,要编2个码:“主码(即码元所在键位)+补码(规定取该码元最后的笔画结构)”。如下表所示:
注 :表中带圆圈的笔画 、 等,是“补码”的笔画表示形式,作为一个符号,用以提示编码。
这4个补码码元中的“犭、礻、衤”等三个字根,本身也是汉字,这三个汉字的编码规则是,要先“报户口”(主码+补码)(已占用2个码)、再打该字的第1笔和最后1笔,共取4码。即:
不难发现,并不是键位上所有的字根都可以“打出来”!如“11”和补码码元“”等,那是因为这些字根本身并不是汉字。
提示:“补码码元”的设计,完全是为了保证键面字根的完整性和部件规范。其实,它们的编码效果和86版完全一样,只是换了个“说法”罢了!也就是说,对于,你就当作是86版的“”和“”仍然在Q和P键上,仍然按86版的犭=丿、礻=丶、衤=冫编码输入,效果完全一样!
第三节 “键外字”的拆分法
本节是学习五笔字型的重点内容。
凡是“字根总表”上没有的汉字,都是“键外字”。它们都是由几个码元(字根)组合而成的,我们也把这类字称为“多元字”。
对于“多元字”,我们的办法,只有一个字——拆!
我们必须把由若干个字根构成的字,都“拆”成为一串字根表上列有的“字根”!怎么“拆”呢?必须按照一定的规则“拆”。科学、实用又没有“二义性”的“拆”法,共有以下5项规则(参见本章第一节“编码流程图”):
1、书写顺序
“合体字”拆成“字根”,一般情况下,要按照正确书写顺序进行。
例如:
新:立 木 斤(顺序正确)
立 斤 木(顺序错误)
2、取大优先
要“拆”出“笔画尽可能多”的“字根”。要以“再添一个笔画,便不能构成为笔画更多的字根”为限度!例如:
失: 人(正确,再添一笔, 就不是字根了)
大(错误,再添一笔成为“”,比“”要大)
估:亻 古 (正确)
亻 十 口(错误,因为“口”可添到前面的“十”上,“凑”成更多笔画的字根“古”)
注:“取大优先”,俗称“尽量往前凑”。因为“向前凑”总是有限度的,要凑成字根表中笔画更多(更大)的一个!否则,便没有“章法”了,势必有许多种“拆法”甚至都要拆成单笔画!在汉字拆分中,这是一个最常用到的、保证拆分唯一性的基本原则。
3、兼顾直观
在编码时,为了使码元特征明显易辨,有时就要暂时牺牲“书写顺序”和“取大优先”的原则,形成个别例外的情况。
例:“国”字
按“书写顺序”,其码元应是:“冂王丶一”,但这样编码,不但有悖于该字的字源,也不能使码元“囗”直观易辨。我们只好违背“书写顺序”,按“囗王丶”的顺序编码。同样的例子又如:
自:丿 目 (正确,但并没有“取大优先”)
亻 三 (错误,虽按“取大优先”拆分了,但不直观,有悖于字源)
注:“自”是一个指事字,上面是一个手指,下面的“目”原本是鼻子的象形,意即用指头指着鼻子代表“自己”。
4、能连不交
请看以下取码实例:
天:一 大 (正确,“一”与“大”是相连接的关系,比较直观)
二 人 (错误,“二”与“人”交叉在一起了)
生:丿 (正确,“丿”与“”是相连的,直观可取)
土 (错误,“丿”与“”是相连的,直观可取)
一般来说,“连”比“交”更为“直观”,更能显现码元的笔画结构特征,更易于辨认。
5、能散不连
有时候,一个汉字的几个码元,都不是单笔画,这些码元之间的关系,常常在“散”和“连”之间模棱两可。
如:
占: 口,两个码元按“连”处理,便是杂合型(3型)字,如按“散”处理,便是上下型(2型)字。
矢: 大,两个码元按“连”处理,“矢”便是杂合型(3型)字;两个码元如果按“散”处理,“矢”便是上下型(2型)字。
又如:羊: 、 (两个字根,可视为散,也可当作连)
午: 、十(两个字根,可视为散,也可当作连)
都是既可“连”,又可“散”的关系。
当遇到这种既能“散”,又能“连”的情况时,我们规定:只要不是单笔画,一律按“能散不连”判别,即优先确定为“散”的关系。
由此可见,以上两例中的“占”和“矢”,都被认为是“上下型”,即作为2型字(这样规定,仅仅是为取码的严密性设计,并不影响你的书写习惯和汉字结构!)。
第四节 四元字及多元字的取码法
一、“四元字”的编码规则
键外字中的“四元字”,是指刚好由四个字根构成的字。其拆分之后的取码方法是“依照书写顺序输入字根”。例如:
|
|||||||||||||||
|
|||||||||||||||
|
|||||||||||||||
|
二、“多元字”的取码规则 —— “前三末一”(一二三末)
键外字中的“多元字”,是指由4个以上的字根构成的字。这种字,不管实际上能“拆”成几个字根,我们只需“按书写顺序,取拆分结果的第一 二 三及最末一个字根”便可,俗称“一二三末”,共输入四个码。例如:
|
|||||||||||||||||||||
|
第五节 末笔字型识别码
汉字编码输入法的设计,要尽量减少重码,以提高输入的唯一性。但从以下两种情形我们看到,仅仅输入字根,很容易产生重码:
(1)、因构字的字根相同,字型不同引起重码:
叭:口 八(23 34 KW)
只:口 八(23 34 KW)
这个例子说明,编码中丢失了字型信息,才产生了重码。
(2)、因几个字根同一键位引起重码:
沐:氵 木(43 14 IS)
汀:氵 丁(43 14 IS)
洒:氵 西(43 14 IS)
这个例子说明,编码没有将“木、丁、西”加以区分,才产生了重码。
由以上两类例子可知,当遇到2-3个字根构成的汉字时,为了避免编码相同(重码),既有必要提取“字型信息”,又有必要从字根上“提取笔画特征信息”用于编码。复合这两种信息的一个附加码,就是“末笔字型识别码”简称“识别码”,“识别码”只追加在由2-3个字根构成的汉字编码中(见下节)。
“识别码”是由“末笔”代号加“字型”代号构成的一个“复合附加码”。1、2、3型汉字的识别码共有15个(各有3种形式),其构成如下:
|
第六节 二元字及三元字的取码法
“键外字”中,只有2个字根的字,叫“二元字”;只有3个字根的字,叫“三元字”。输入时,键外字毫无例外地都要“拆”!
“二元字”或“三元字”的输入法是:
先“拆”成字根,输入字根后,再追加一个“末笔字型识别码”(简称“识别码”)。有了识别码可以大量减少重码。
“识别码”的简易直观表示法——用带圆圈的笔画表示“识别码”:
1、左右型(1型)字的“识别码”
对于1型(左右型)字,字根输入之后,补打“1个末笔画”,就等同于添加了“识别码”,用表示之。例如:
|
||||||||||||||||
|
2、上下型(2型)字的“识别码
对于2型(上下型)字,码元输入之后,补打“2个末笔画”的字根,就等同于添加了“识别码”,用表示之。例如:
|
||||||||||||||||
|
||||||||||||||||
|
3、杂合型(3型)字的“识别码”
对于3型(杂合型)字,码元输完之后,补打“3个末笔画”的字根,就等同于添加了“识别码”,用表示之。例如:
|
||||||||||||||||
|
||||||||||||||||
|
||||||||||||||||
|
||||||||||||||||
注1:凡是“包围型”的字,如全包围字“国、团”等,半包围字“这、庆”等,均以被包围的那个部分的“末笔”作为整个字的“末笔”来构成“识别码”,如“远”字,要以被包围的“儿”的末笔来构成“识别码”(53?V)。
注2:识别码一共有3种表示法,其编码的效果完全相同,都是同一个码!可以按照下面的方法打“识别码”,例如:
末笔横的1型字:打11键,就是G键,就是(一个横)键!
末笔撇的3型字:打33键,就是E键,就是(三个撇)键!
其所以如此,道理很简单:1区1位(G)上有1个横,3区3位(E)上有3个撇……
第七节 简码和容错码输入
一、简码输入
一些常用的字,除按它的“全码”可输入外,为减少打键次数,只输入其全码的最前边的1个、2个或3个码,再加打空格键,也可以输入,这就是一、二、三级简码。简码可以提高输入效率。
“简码”正如人的名字,比如名字“赵丽梅”,就是“全码”,“二级简码”——丽梅,最亲近的人则叫“一级简码”——梅。
1、一级简码(又称“高频字”)
将字母键打一下,再打一下空格键,即可打出25个最常用的汉字如下表:
2、二级简码(只输入“全码”的前2个码)
化:亻 匕(34 55 WX)
李:木 子(14 52 SB)
理论上,二级简码共有25×25=625个,可参见附录二级简码表。
3、三级简码(只输入“全码”的前3个码)
想:木 目 心(14 21 51 SHN)
巍:山 禾 女 (25 31 53 MTV)
三级简码的数量比较多,理论上有25×25×25=15625个,实际上有许多“空位”,这里不再列出。但输入软件对三级简码是作了标示的。在输入过程中会发现,“提示框”中有些字的后面带个“*”号,就说明这样的字是简码字。
如:输入“将”,当输入前三个编码“uqf”后,我们看到“将”的后面有“*”号,这就是告诉我们“将”字是有“三级简码”的,此时,不必打最后一个字根,只要按一下空格键,“将”字上屏。
注:上图中,“将”的后面还有一个字母“Y”,那是提示,还剩下一个编码“Y”没有输入,在有“*”号的情况下,Y就不必输入,直接打空格键,三级简码字就可以上屏了。
有些字因为很常用,它可能有一级简码,也可能同时还有二级简码和三级简码。如“经”字,就有一、二、三级简码。
经:X (加空格)
经:X C (加空格)
经:X C G(加空格)
二、容错码
“容错码”的涵义是:“容易”编错,但“容许”按错码输入。例如:
|
||||||||||||
|
如果按“容错码”输入,大一统软件会自动提示出正确的编码。例如对于“左”字输入“DAD”,在提示框中,会提示“左”的正确编码“DAF”,及正确的字根分解“工”(是末笔为“一”的2型字的“识别码”)。
万能键Z
输入汉字时,如果一时不知道某些字的编码,便可以用“万能键Z”来代替“不知道的那个码”。Z键的用途主要可分以下三种情况:
1.当不知道某个字的拆分时,用Z代替不知道的字根,例:
键:钅 Z Z 廴
2.当不知道字根在哪个键位上时,用Z代替,例:
论:讠 人 Z Z
3.当不知道字的“识别码”时,可用Z代替,例:
花:艹 亻 匕 Z
万能键Z也叫学习键。一旦使用Z键,提示行中便会有比较多的字显示出来,其中会有你要的那个字,而且,字的后边还有正确码的提示。
当然,用Z键越多,提示行的字也就越多。如果你打了4个“Z”,那提示就把全部汉字都显示一遍——因为你没有告诉电脑,你要的那个字有什么特征。
第八节 词汇输入
在字母键上,打4个键,不用换档,既能打单字,又能打词汇,字、词之间没有界限,这是发明人1983年的一项重大创造——字词兼容。
在输入词汇时,不管多长的词汇,一律只打4下键,单字和词汇可以混合输入,字词之间不用任何换档或其它附加操作。词汇输入法为:
一、2字词
取每个字“全码”的前两个码组成,共4码。例如:
例如:
|
|||||||||||
|
二、3字词
前两个字,各取第一个码,最后一字取前两个码,共4码。例如:
例如:
|
|||||||||||
|
三、4字以上的词
对于4个字或超过4个字的词,取第一、二、三及最后一个汉字的第一码,共4码。例如:
|
|||||||||||
|
|||||||||||
|