仓许默汉字体系”全名:仓颉_许慎_默公层级式汉字体系

一、简介

许慎的《说文解字》是存世的最早字书。它不仅仅是我们现在理解的字典,更重要的是系统提供了汉字构造的基础元件——部首及造字的六书四象等汉字造字的规律。许慎在《说文解字》中建立了以540个部首为基础的汉字造字规则体系。在《说文解字》之后,虽然后世持续有新的字书推出,并且收录字数不断增加,但部首基本稳定在《说文解字》建立的540个范围内,甚至后世简化为明代《字汇》的214个,并且沿用至今。这充分说明许慎的《说文解字》在部首的收录和造字规则上已经达到一个顶峰。只是许慎的部首体系本身没有严格分级。

遗憾的是,中国现在的“语文”教育体系近乎放弃了部首的教育和传承,而是以字为基础进行语言学习,并且将语文这门课程定位成简化版的文学专业课,从而使汉语学习在一开始就失去了“全科”与“通识”的本质。


默公《说文解字教本》颠覆了许慎“据形系联”,建立了“义类统领”的严格树形科学分类结构,重建了部首三级分类体系。核心为6个一级类→90个二级类→540个三级类的树形分类系统。

这套严谨的汉字部首分级体系,远远不止是汉字研究的颠覆性突破,最重要的是通过恢复部首为基础的学习和继承,突显了中华文明近乎所有核心的精华,其科学化程度达到令人惊艳的水平。

部首,以及用它为基础构造汉字的规律,是中华文化最核心的精华。部首,是中国老祖宗对宇宙一切属性最高度的慨括和精练,集中体现了中华文明的思维方式,也是今天的时代最迫切需要的文明营养。

需要特别强调的一点是:今天之所以要特别推崇以汉字为基础的中华文明传统文化,并不单纯是因为它有五千年悠久历史,曾经有多么辉煌,而是因为从未来人类文明发展角度来说,它正好是人类进入未来的第四次工业革命、第三代科学革命、以人工智能为代表的未来智业革命所必须的。人工智能不能只是去堆算力和消耗更多电力,而必须在另一条路径上大力开拓:就是人类的知识和信息熵值最小化,从而以最小的算力和电力消耗而获得更好的训练结果。这个只有重新进行汉字革命和与其相呼应的第三代科学才有可能实现。


二、严格层级化的汉字体系意义和价值


1. 以化学物质为参照理解层级体系

要理解什么是层级化,我们可以参照一下化学物质的层级体系。化学物质的构成遵循“原子→化学键→微观结构→宏观物质→各类物体”的层级逻辑,化学键类型决定微观结构,微观结构决定物质的物理化学性质。

(1) 门捷列夫发现了原子的元素周期表,一切化学物质都是由原子按照层级构成的。截至2026年1月,元素周期表中已被正式确认的化学元素共118种,原子序数从1(氢)到118(鿫,Oganesson,Og)。每一种原子的化学性质是一样的,只是会有不同的同位素——就是化学性质一样,只是原子量不一样(原子核里中子数量不一样)的变种。

(2) 化学键是原子相互之间进行结合的作用力和规律。

(3) 原子通过化学键相互结合形成物质的微观结构,主要是分子,另外还有离子构成形式以及晶体。

(4) 微观物质可在宏观上形成纯净物质,混合物,聚合物等。

(5) 不同的宏观物质以物理方式结合形成宏观的千千万万各个实际物体:人体、各种生物、山川河流、大气云雨、更宏观的星体等等。

截至2026年1月,以CAS REGISTRY(美国化学文摘社物质数据库)为相对权威的统计口径,已收录并分配唯一CAS号的不同化学物质(含分子型化合物、单质、合金、聚合物、UVCBs等)总量已超2.9亿种,其中分子型化合物占绝大多数,且仍以日均数千至上万种的速度持续新增。其实,现实世界中的物质数量会比2.9亿种多得多,因为以不同单一CAS混合还可以形成更多种类的物质。

但所有这些化学物质和宏观物体,追根溯源都是由这目前来看最多118种元素构成的。有了化学元素周期表,我们就可以理解不同化学物质之间的底层关系和它们的形成规律。如果没有它,人们就只能死记硬背大量表面上毫无关联的化学物质性质和名称。

2. 仓许默汉字层级体系

构成汉字的“原子”就是部首,许慎《说文解字》中最多540个部首。但原子本身也是极其有规律的,这就是门捷列夫元素周期表。在默公之前,并没有对部首本身的规律规定那么严格。默公的重大贡献是建立了汉字部首的“元素周期表”,他将540个部首规范成了非常严格的三级分类体:

6个一级类→90个二级类→540个三级类(也有四级甚至五级,但实际应用中三级就足够了)。

许慎在撰写《说文解字》时,更早期的甲骨文已经失传了。默公充分吸收了甲骨文等中国文字演化的最新研究成果,使中国文字发展演变的历史更为清晰,其规律性和科学性达到极致。

默公将这些研究成果集中体现在其编撰的《说文解字教本》中。

可以说,汉字是由部首,按照造字规则形成的。由汉字可以形成词组来表达更多的事物。这些形成文明的微观单元。

再由汉字与词组形成书信、诗词歌赋、官方文件、商业文书等宏观的语言单元应用。

将以上语文单元应用整理成书,更进一步将更多书形成文明系列的典籍,如:经、史、子、集等。

3. 价值和意义

默公的这个研究成果远远不只是汉字发展历史的一个纯学术成就,而是对整个人类文明发展具有极大的颠覆性意义。他不仅使我们真正理解了汉字以及中华文明的精华与价值,也将对整个教育体系和人类文明的学术体系带来颠覆性的改变。对我们理解科学、语言的本质等都具有不可估量的意义和价值。

首先是中华文明与其他文明的关键性区别,主要体现在部首上,而不是“单字”上。事实上,所有拼音文字也都可以看成是层级体系的。其最底层是字母,一般各个拼音文字体系的字母数量都很少。例如英文就是只有26个字母。日语的50个片假名数量就已经算比较多的了。它们与汉字部首之间关键性的区别在于,拼音语文字的字母都是表音的,基本上没有任何实际意义。

更高一层就是以字母构成单词。由单词组成词组。

再往上与汉字表面上就很难看出有太大区别了。

我们都知道汉字与拼音文字的重大区别在于它的表意上。不过,如果我们只是对比各个汉字“单字”与拼音文字的“单词”的话,很难清晰区别两者间的表音表意上巨大差异如何体现。因为大量拼音文字的单词似乎也有表意的性质。例如一些词根或词缀:-tive,-able等不仅是表示它是形容词,而且-able还有“使……能”等表意性。im-等前缀有否定的表意性。所以,如果仅仅从字或单词及其以上的层级进行对比,汉字的表意性并不是显得那么地不同。

关键性的区别是在部首上。汉字的部首从层级上看是类似于拼音文字的字母,都位于最底层,甚至有些汉字在构造单字时的部首也是表音的。例如汉字的“江”,右边的“工”最初就是表音。“江”字最初发音就是与“工”相同的gong,而不是现在的jiang。但汉字的部首本身全部都是表意的,即使在构造单字时是表音的,它本身也是表意的,这才使汉字体现出以表意为主要特征。

其次是汉字的熵值最小化特性,这体现在部首的数量适度上。所有文字都是以“字母”或“部首”为最小的基础单元,以此为基础构造成“单字”或“单词”。这个本质上并没有不同。但从文字系统的经济性上看,区别在于是否符合熵值最小化的原理。熵值最小化,意味着文字和语言表达同样的意思需要的文字和语言数量最少,从而学习和记忆的数量就最少。这个可以用信息论中霍夫曼编码的原理来证明。霍夫曼编码是一种基于信息熵的无损数据压缩算法,由大卫・霍夫曼(David A. Huffman)于1952年提出,核心思想是对出现频率高的符号分配短编码,频率低的符号分配长编码,从而最小化编码后的总信息熵最小化。英文字母只有26个,绝大多数拼音文字的字母数量都差不多,不能过少。字母过少带来的问题是,组成单词时需要较多的字母。仅包含一个字母的英文单词只有两个:i(我)和a(一个),两个字母的只有20多个。很多高频单词的字母数量达到12至15个。但汉字的部首有540个,即使常用的也有200个,数量适度。另外单字与部首其实都是一个字的长度。因此构造的单字有5000到1万多。2到4个字组成的词组、成语、新名词等基本就可适应社会与科技的发展需要。假设以5000汉字为基础进行组合,2字词组空间有2500万,3字1250亿,4字625万亿,其空间非常充裕。

拼音文字其实也可以用单词来形成词组,问题只是单词已经很长了,如果多个单词构成的词组,其长度很容易就会失控,太长了。因此与采用拼音文字形成词组相比,它往往是取词组中第一个字母拼成简略词,形成新单词。如激光,其英文词组名是“Light Amplification by Stimulated Emission of Radiation”(受激辐射光放大)。因这个英文词组名太长了,就变成取第一个字母的缩略词laser,但因为英文的字母没有任何表意性,就使这个新词完全看不到原来的含义了,而中文将“受激辐射光放大”缩略成“激光”,依然很好地保留了原意。大量的英文词组因太长,不得不采用取第一个字母组成新词,或者截取部分词根词缀构成新词。后面的词根词缀构词法形成的新单词还算有一定的表意性,但它们已经是新单词了。这使英文每年产生大量的新单词,据统计每年高达2万多个,而累积的英文单词数量已经多达上百万。如此庞大的单词数量使得学习的负担越来越重。这将成为以英文作为母语的民族,无法进一步迈向第四代工业革命和第三代科学文明的关键性障碍。

汉字的熵值最小化特征使汉字形成的文章长度比其他拼音文字语言可以少很多。现在是白话文,已经比较啰嗦,还是普遍比拼音文字短,如果采用文言文,其长度更是比拼音文字少得多。加上汉字的表意性,使得学习者很容易理解新词,从而极大地减轻学习新知识的负担。

第三是汉字的同一性。体现为空间上的同一性与时间上的同一性。空间上的同一性可使空间上跨度极大的不同地区都保持语言的同一性;时间上的同一性,体现为语言的时间稳定性。如果人类未来进入星际移民和旅行的时代,汉字可能是唯一可以适用的语言。因为星际旅行,尤其是跨星系的移民,可能会达到百年和千年的时间跨度。如果采用其他拼音文字的语言,一个星际旅行往返,等他们回来时,可能地球上航天基地的人与返回的人根本就没法顺利沟通了,因为无论地球上的人类和星际旅行的人类都已经演化成全新的语言。今天的英国人基本上都已经看不懂400多年前莎士比亚的作品,更别提创作于公元8-10世纪的古英语史诗《贝奥武夫》(Beowulf)了。

唯有采用汉字,无论星际旅行多少年,出发时与回来时的任务说明书和星际任务执行报告都是一样的文字语言。如果用拼音文字,出发时任务说明书是凯尔特语,回来时听报告的人已经只懂印度英语,汇报星际任务的人说的已经是半人马座语,全都对不上听不懂了。

汉字是世界上唯一被证明过经历几千年也可以不发生变化的文字,也就是唯一被实际证明过适合于星际文明的文字语言。

因为文字语言最关键的价值和意义,就是要让不同空间和时间的人能够相互沟通和理解,因此可以说,空间和时间上的同一性是文字语言最基本的特性。从这个意义上说,汉字是地球上唯一合格的文字语言。只有理解了这一点,文化自信才具有最坚实的基础。

第四是第三个优点中空间统一性的推论,也就是汉字是唯一可以实现人类命运共同体的文字。由于拼音文字极不稳定,空间同一性很差,所以它很自然地会倾向于导致国家的分裂。因为时间长了不同地区很自然地因为发音的不同而演化出不同的语言文字,由此就导致形成不同的种族和国家分裂。汉字的空间统一性是中国可以稳定地形成大范围国家的关键条件和原因。如果汉字成为世界语,很自然地就为人类命运共同体建立了最基本的前提条件。

第五是有了仓许默汉字体系,汉字将从最难学习的语言,变成最容易学习的语言。过去人们认为汉字很难学,原因在于没有找到汉字最根本的造字规律。以字为基础进行学习,需要记住5000到7000个字,但从部首开始学习,需要记住的东西数量就极大地减少,并且因为他们有极强的规律性,学会后很难忘掉。事实上,学习他国的拼音文字时,一个非常有效的方法是词根词缀学习法,也就是从拼音文字的造字规律出发来进行学习。但因为拼音文字时间同一性很差,因此词根词缀的规律性并不强、变体和例外很多。虽然如此,借助于这种方法能部分地理解单词的造字规律,也非常有助于理解和有效减少单词的记忆量。而汉字的造字规律性是非常强的,并且变化极少。因此,如果学习汉字以部首为基础,而不是以字为基础,可以极大地减少记忆量,最终会越学越快。

第六是中华传统文化思维方式与现代科学的高度一致性。只有通过部首造字的规律学习,才会充会理解中华文明“名实相符”与现代科学的实验与测量方法的内在一致性。文字就是客观世界、人类思想与精神等对象的名和映射,名实是完全相符的。部首,是中国古人对世界最广泛和最基本属性的最高程度抽象和总结,在此基础上的造字规律,体现了对世界的分析、综合等认知。这种认知方式有其不足之处,主要是精度、严谨性和因果性不足,但它本质上与现代科学文明的实验和测量是完全一致的。

第七是其全科性或通识性。部首本身是对人类所有认知对象属性的高度概括和总结,造字,形成的词组成语等是对世界各个领域的认知。因此,文字和语言本身应当是全科、通识,而绝对不是纯文学专业。中国古代经典中的《尔雅》《尔雅翼》等很多类似字书的典籍,事实上就是博物学或百科类的书籍。如果是从小学开始学语文的,此后很难去读这类典籍。但如果以汉字学为学习的起点,可以很容易读懂任何类型的中华典籍。

当然,我们提到汉字的这些优点,也不是说拼音文字绝对一无是处。当年之所以人们以为汉字是走向科学文明的障碍,是看到拼音文字与现代科学的一些相容性,就是现代科学基本都是采用拼音文字的字母作为符号语言,如变量、运算符号、函数名称、标识等,的确非常简便。例如函数表达式:

y = f (x)

各种数学公式等等,除阿拉伯数字(其实是印度数字甚至有人认为最初是源自中国)外,基本都是援引自拼音文字的字母。

另外西方文明中对严格的因果律,绝对精确性的追求等,是值得充分继承的。但是要从中看到,数学符号采用的就只是拼音文字的字母,而文字反倒成为在科学中占次要地位的。

所以,最完善的语言体系是汉字作为日常交往和叙述性的语言,拼音文字的字母作为理工科专业的文字和语言。


三、必须对语文课进行全面改革 —— 语文是中国教育最大的错误和失败


以上讨论的意义和价值还只是浅层的,最大的意义和价值在于彻底颠覆当前教育和学术界存在的巨大缺陷。

我们现在从小学开始的语文课是一门最基础的课程。表面上看它的本质是母语的语言课,但事实上却不是这样。中国的语文课是学习西方分科方法最失败和最错误的。因为人家拼音文字的学习其实也是从学习字母开始的,但因为其字母实在是太少,所以这部分课程内容在语文课形成时完全被忽视了,导致中文的语文课是以单字为基础开始学习。虽然部首数量看起来很少,但它们却是汉字以及中华传统文化最核心、最精化的内容。这些内容在语文课中几乎被完全抛弃了。只有一些有心的语文老师个人会顺便讲一下。

另一方面,语文课程的内容基本上全是文学性的文章。因此,语文课事实上成为了文学专业不同程度的简化版。从小学、中学到大学,学习语文基本上就成为“纯文学”专业。习字只是这个文学专业课学习过程中顺带完成的任务。这是一个大错特错,并且是错到极点的。这样一来所形成的问题就在于中国的教育从小学入学一开始就已经分科了。这也是现在又开始强调“通识教育”,却总是不得要领的关键所在。

如果是从部首开始学习的“汉字学”,它绝对不是“文科”。因为语言是人类一切知识的“名”和映射,因此它天然地就是“百科”甚至是“全科”“通识”的。中国过去的私塾里,教授中国语言并不是从字开始,而是以《说文解字》为指南以部首为基础,因此,有最符合汉字语言的“通识教育”特性。语文课是我们今天的教育体系缺少通识、全科教育基础的关键祸根所在。

语文从一开始就学习由中文教育家们节选的文学类文章。语文课中整天讲的都是一些硬生生编造出来的“段落大意”“中心思想”,由此形成了一条从小学、中学、高中直到大学形成的、缺少通识和全科、尤其缺少科学常识和基本精神的畸形教育,造就了一批严重缺少认识世界的基本科学方法和素养,习惯于编造和被国外忽悠的“文人群体”。

但以中国传统教育出来的人才,即使是精英中的“文官”,也并不是我们今天理解的“文人”,而是具有与当时的技术时代相符合的“通才”。科举中的举人,很有可能成为七品的县官,这也是当时的知识分子考科举的最大动力之一。县官最重要的工作之一并不是去写文学类的小说或诗词歌赋,而是判案。要判案,其必须具备的基本知识是刑侦、逻辑推理、百科知识等全科型知识体系。另外还有修水利、农业等,这些也都需要通才和百科。

另外,中国历史上很多时候会出现一些从来没打过仗的文官,在危难时突然之间成为杰出的将帅。例如赵括的父亲赵奢,三国时的周瑜、陆逊,南宋时的虞允文、文天祥,唐朝睢阳之战的张巡,明朝的王阳明、袁崇焕等。如果他们不具备军事素养肯定是不可能做到的。因为他们在一开始中学习汉字过程中,不仅掌握了当时科学的基本认识方法,而且通常阅读过大量兵书或战例。因此,一旦他们有统领军队的机会,甚至比一般的将军更加善于用兵。如果是现在文科专业的“文人”,几乎可以肯定不太可能再出现这种情况。

这个也有效解释了我过去曾很长时间难以理解的一些谜团。例如,毛泽东思想的调查研究方法,本质上就是现代科学的实验与测量方法。毛泽东本人并没有在物理学等现代科学学科上有很多学习和造诣,他本人在学校主要学习的全是今天看来是“文史哲”类的知识,怎么会具备如此颇具现代科学基本精神的认知方法呢?如果能理解他有幸受到过中国传统私塾中曾有过的汉字学通识教育,并且受到过陈独秀等提出的“德先生”“赛先生”的感召,就能很容易理解了。他在《新青年》上发表的第一篇文章,居然是以“二十八画生”为笔名写的《体育之研究》。他同样是未进任何军校,却成为古往今来历史上最杰出军事家。

另外粟裕等受过的教育也很少,为什么能具备此如杰出军事才能,其受到的教育也是传统私塾中的汉字学教育是一个重要基础。钱学森等也是在早期受过汉字学教育的。这是其具备通才的一个基础原因所在。

因此,强烈建议尽快取消语文这门糟糕透顶的课程,而分解为以部首为基础的“汉字学”以及“阅读与写作”这两门课程。小学开始应当以“汉字学”为主,一、二年级可以不用开设“阅读与写作”课,可待三年级再开设。“汉字学”的学习到小学毕业就可以永远结束了。通过以默公创立和完善的“仓许默汉字体系”教学方法,一些4岁的孩子经过仅仅不到两年的学习,到6岁刚开始进入小学的年纪,居然就可以顺利地阅读中国大量经典文献了。这类经典以今天的语文课教育到大学都未必能读得明白。通过这些学习的孩子不仅在“阅读与写作”上能力突出,在物理、数学、化学等专业学科上也都具备良好基础。理解化学物质与汉字造字体系是完全类似的。

从现代科学时代的角度考虑,今天的“汉字学”不能仅仅包含中国传统文化的汉字,而应当将现代科学的部分基本符号也涵盖进来。

现代的语文课内容全是文学性的文章,“阅读与写作”应当将诗词歌赋、小说杂文、日常信件、商业信函与合同、法律文书、新闻稿、论文、政府文件等各类阅读与写作全包括进来,这才是真正培养有用人才的方式。

我们以上叙述中是以化学为参照来理解汉字学。反过来,如果先学习汉字学,反过来去学化学,就很轻松了。以原子为基础去构造分子,与部首为基础构造汉字,其相似度是极高的。科学的分类与分级方法,组合式创新方法,全科型的知识结构,全都体现在汉字学里。


四、仓许默汉字体系与第三代科学的关系


仓许默汉字体系的本质,是其找到了以最少的学习量涵盖最多知识量的途径和方法,或称“熵值最小化知识归纳和学习方法”。第三代科学的本质目标也是这个,只不过面向的是整个人类现有的科技专业知识体系。由于近代科技的发展是以实验与测量方法为基础,将各个领域的知识从自然哲学和哲学中一个个分离出来,形成一个个独立的学科。这些学科不断深化,又形成更细分的学科。由于学科间的隔阂,形成的新知识在学科之间存在海量的重复。

描述相同对象的语出现不同表达的原因有很多:

  • 自然的变异。因为各个人群理解的不同和表达习惯的不同,出现语言表达的变异。

  • 艺术化或流行化的描述。例如将哈尔滨说成尔滨,把南方人说成小土豆。类似表达有些很可能久而久之就成正式语言。

  • 人为原因。类似黑话。本来语言是要将人相互理解,但有些为保密原因就是不想让外人理解,而只限群内人理解。例如有些赌博群体为避免让人以为他们赌博金额过大,就故意将1元说成是1分,将1000元说成“一吨”。

  • 避免重复、侵权责任。论文有查重要求,为避免自己事实上抄的内容被发现,就把相同的内容换个名称和说法。

  • 新的独立学科会有相应的编制和预算,因此学术界也倾向于搞出不同的表达来形成新的有差异性的学科。

  • 其他。 

如果真正是新的知识,当然需要用有差异性的语言进行表达。但第三代科学的研究发现,即使现代科学中的绝大多数知识,并不是真正的差异,而只是“说法”的不同。第三代科学就是要站在整个科学的全科型视角,将一切现代科学中从最低层到最高层具有普遍性的知识进行总结归并,建立严格的层级体系,从而使知识量(熵值)成千上万倍地压缩。

随着科技知识的增长,人类现在的学习周期已经越来越失控。从小学6年、初中3年、高中3年、大学4年、研究生3年到博士5年,学期会长达24年。从7岁入学到博士毕业时已经31岁了。退休年纪女55岁(现58岁),男60岁(现63岁),工作时间仅30年左右。再加上从学校毕业后还得1、2年实践经验才能完全适应工作,有效工作时间就更短了。这个投入产岀比实在是太低了。

毛主席当年就提出“学制要缩短,教育要革命”,钱学森当年也说过“人再笨,14岁还能学不会微积分吗?”,并主张8岁前完成小学课程、16岁前大学毕业。如果人们以现有的教育和学科知识体系为基础,是根本无法理解、甚至根本无法想象他们所说的观点的。有些人就认为是因为钱学森智商太高,所以不理解智商低的人,事实上完全不是这样。如果采用仓许默汉字教育体系和第三代科学方法,学习应当是越学越简单越容易,因为从一开始学习的就是最基础的规律和方法。16岁前大学毕业,20岁前博士毕业,并且不是只学了一个很狭窄专业,而是“通晓整个人类全部的知识、专精某一群领域”就不是什么难事了。

我可以举一个简单的例子来说明这一点。我有一次与一众学者去和做“器官芯片”的企业交流。对什么是器官芯片的基本概念问题,双方谈了半天依然是一头雾水。后来我就打断,听我来解释吧:

说到“芯片”,这事实上已经在科技词汇发展过程中失去原意了。最原始的概念是“集成电路”(英文是integrated circuit),其关键是在“集成”,也就是把多个电路单元集成在很小的基座上并且封装成单一器件。只是在后来发展过程中较多采用Chip(碎片、薄片)一词,这个是失去专业含义而只取表面形状的俗语。因此,如果理解“集成”这个关键内涵,就知道“器官芯片”,其实就是“集成的不同人工培育的器官”。理解了这个专业术语,不用再解释,马上就可以很容易理解所谓“量子芯片”“光子芯片”等,准确含义就是“集成的量子器件”“集成的光子器件”,马上一通百通。如果不采用这种科学化、层级化的科学知识归纳和学习方法,不仅一个一个地死记硬背难度极高,学习量数量级地增加,越学越难,更重要的是对大多数人来说,学了半天还是一头雾水。尤其是随着人类科技的迅猛发展,永远也学不完,越学、面对的不懂的东西却越多。

由此延伸,可能有人马上就会联想到,既然集成的微型功能单元就是芯片,那如果用一些微型的机械在固定基座上进行集成,难道也可以称芯片吗?事情还真的就是如此,MEMS是Micro-Electro-Mechanical Systems的缩写,中文译为微机电系统,这就是一种机电芯片。

在机械领域有一个与“集成”相对应的术语叫“总成”。只不过“总成”并不强调体积上集成在很小的片状基座上,可能体积重量都较大。但无论集成还是总成,其技术原理上存在高度相似之处:后续包装运输、安装使用的方便性,自身功能和性能的稳定性等。这样不仅是在几分钟之内就精通了按现有教育几天几夜都讲不完讲不透的一大群专业术语,更关键的是搞明白了为什么要这么做的内在原因。

这就叫一点就通、一通百通、举一反三,甚至是未学先通、不学就会。这样来学习,才能越学越简单容易,越具备创造性思维,才会使学习时间极大地压缩。

当然,以上理解对专业领域的人员来说可能是不够的。真正专业从事某个领域的人关心是最细节的差异。只是对第三代科学来说,要从宏观的概念深入到最细节的差异,方法也都是有高度相似性和规律的。例如不同“芯片”,其集成的生产工艺当然会有不同,可以通过对通用的“生产规律来一层层深入。一旦采用如此方法就会明白,任何一个专业领域,其实真正全新的知识信息是极少极少的。此处不再深入展开。

当前人类的科技已经进入人工智能(AI)的时代。什么是AI?就是全科型的知识库。它可以无所不知,无所不晓,无所不通。人类要想不被AI取代,就必须也同步进化到全科型的知识总结和学习时代,也就是第三代科学时代。

仓许默汉字体系就是日常生活语言中的第三代科学,第三代科学就是专业科技知识语言领域的仓许默汉字体系。


五、汉字造字历史介绍

仓颉

中国文献记载中“仓颉造字”。最早文献见于《春秋元命苞》,原书虽佚,但通过清代马骕《绎史》等辑本留存部分佚文,成为研究中国古代文字起源的重要文献依据。有些介绍称“仓颉造字”属于神话,这个并不是最重要的。虽说仓颉是汉字造字第一人,但我更建议采用他是“系统总结和规范”了汉字,而不是从零开始的“造”字。因为从目前考古发现来看,在他之前很早,中国就已经有大量古代的文字或刻符,分散在不同地区,例如9000年前的贾湖刻符等。他肯定是对这些分散在不同地区的不同文字进行了系统地总结,总结出了规律,进行了规范、增补。

秦代的《仓颉篇》是目前中国文献和传说中知道的最早的字典(字书),其收录的汉字有3000多字。此后还有:

《爱历篇》(秦,3000余字)

《博学篇》(秦,3000余字)

《训纂篇》(汉,5340字)

《滂喜篇》(汉,7380字)。

但这些汉代及之前的字典目前都已经失传。他们失传的原因,可能是与历史上古代典籍失传类似的原因,如人为焚书,战乱等。但另一个更重要的可能原因是东汉许慎的《说文解字》出现后,因被认可度非常高,规范度也极高,因此被广泛使用,通过抄写及印刷复制的数量较多,从而得以完整存世。而此前的其他的字书因《说文解字》出现后不再有实用价值,仅作为典籍被收藏。这样因数量太少,就很容易因各种原因而最终失传。

在《说文解字》出现后,虽然也持续有新的字书出现,但皆以《说文解字》为基础,尤其构字的方法体系是以《说文解字》为基础,在文字上增加,而在部首上反而是精减。这使得即使出现新的字书,但《说文解字》的版本依然被大量复制利用。

许慎

《说文解字》的作者。(约58-约147),字叔重,汝南召陵(今河南省漯河市召陵区)人,东汉古文经学家、文字学家、训诂学家和词汇学家,被后人尊称为“字圣”。《说文解字》全书共分450部,首创部首编排法,收集9353字,后又多次删改,于建光元年(121年)最终定稿,由其子许冲上表献书。此后,许慎回归故里,在家乡及附近村庄授经教书,建和元年(147年)卒于家中,享年约九十岁,葬于今漯河市姬石镇许庄村东100米。

图片

《说文解字》面世之后,汉字就变化极少了。最大的一次变化是中国建国后的简化汉字,就是现今使用的简化汉字。但简化汉字事实上更多回归到了金文和甲骨文的更源头时代,精简了后世增加的繁体部分,并非随意简化。

这里还有一个不得不提一下的重要插曲。中国在建国前后,差一点就废除了汉字而转向拼音文字,因为废除汉字采用拼音文字是当时几乎所有各派主流学者一致的看法,甚至是迫不急待的看法。但作为少数派,甚至是极少数派的毛泽东坚决反对这一看法。他认为中华五千年的文明史就体现在方块字上,任何拉丁化都行不通。毛泽东在历史上多次挽救了党、挽救了军队、挽救了人民的功绩是众所周知的。但他挽救了中华文明的基础汉字却是少有人知。汉字不能废,但可以简化。这形成了后来的简化版汉字。

《说文解字》面世之后出现的历代字书总表图片

从上表可见,自秦代之后,汉字的字书收录的文字数量越来越多,意味着随时间推移新造的字越来越多,但部首却极为稳定,甚至在明代《字汇》减少为214个,一直未超越《说文解字》部首范围。

计算机字库图片


默公

在《说文解字》部首基础上进行了重大发展和创新。许慎的《说文解字》按“据形系联”,以语义为核心,共有共分540个偏旁部首。后世字书多承其例,如《玉篇》542 部,至明代《字汇》定型214部,沿用至今。

默公《说文解字教本》颠覆许慎“据形系联”,以“义类统领”的树形三级分类结构,重建了高度科学化的偏旁部首三级分类体系。核心为6个一级类→90个二级类→540个三级类的树形分类系统。

一级六大类:人体、器用、天地、草木、鸟兽、符号;

其下有二级和三级分类。

注意,默公部首分级的完全版本有四级甚至五级分类,但真正实用的就是三级。全书保留约7400字头、5500字条,部首统领字同步精简。

默公《说文解字教本》各类部首数量图片

其中核心常用部首仅180-200个,覆盖教本常用字约90%以上构字需求。

常用部首数量与分类分布表图片

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *