第一节 汉字的起源

事物的形成一般都要经历一个或长或短的过程,文字也不例外。以别的语言的文字为依傍,有时能为一种语言很快地制定出一套完整的文字来。但是就完全或基本上独立创造的文字来说,从第一批文字的出现到能够完整地记录语言的文字体系的最后形成,总是需要经历一段很长的时间的。还不能完整记录语言的文字可以称为原始文字。汉字是一种独立创造的文字,它无疑是在经历了相当长的原始文字阶段以后,才发展成为完整的文字体系的。所以汉字起源的问题实际上包含了下述两方面的内容:汉字是怎样从最原始的文字逐步发展成为能够完整地记录汉语的文字体系的;汉字这一文字体系的形成过程开始于何时结束于何时。由于缺乏原始汉字的资料,对这两个问题目前都还无法作出确切的答复。下面先对已有的关于汉字起源的一些说法略作讨论,然后简单谈谈我们对汉字形成的过程和时间的一些初步推测。

一、关于汉字起源的旧说

仓颉造字的传说

这一传说最早见于战国晚期的文献:

奚仲作车,仓颉作书,后稷作稼,皋陶作刑,昆吾作陶,夏鲧作城,此六人者,所作当矣。

(《吕氏春秋·君守》)

沮诵、仓颉作书。(《广韵》鱼韵“沮”字下引《世本》)仓颉之作书也,自环者谓之私, 背私者谓之公。(《韩非子·五蠹》)

秦代李斯所编的字书《仓颉篇》也是由于首句是“仓颉作书”而得名的。古

人称文字为“书”,作书就是造字。

仓颉作书的传说在战国晚期显然已经很流行。这一传说无疑在较早的时候就已经出现了。它有没有某种程度的可靠性呢?汉字当然不是个别人造出来的。不过在汉字形成的过程里,尤其在最后阶段,很可能有个别人曾起过极其重要的作用。仓颉也许就是这样的人。早在战国晚期,就有学者作过类似的解释。《荀子·解蔽》说:“好书者众矣,而仓颉独传者,壹也。”认为仓颉只是众多“好书者”中由于用心专一而最有成就的一个。

但是上引《吕氏春秋》所举的六个人,除仓颉外都是见于时代较早的典籍的古史名人,唯独仓颉在现存的早于战国晚期的古籍中从来没有提到过, 在战国晚期的古籍中也没有关于仓颉的时代以及他在造字之外的事迹的任何记载。汉代人多认为仓颉是黄帝的史官(《尚书·序》孔颖达《正义》:“司马迁、班固⋯⋯皆云仓颉黄帝之史官也。”),恐怕未必有确据。魏晋以后人把仓颉说成早于黄帝的远古帝王,就更荒诞无稽了(参看唐兰《中国文字学》53—54 页。以下引作“唐书”)。也许仓颉只是古人所虚拟的一个文化英雄。

在上引《世本》中跟仓颉并提的沮诵,也是名不见经传的人物。汉魏间的宋衷的《世本》注说:“黄帝之世始立史官,苍颉、沮诵居其职。”(《初学记·卷二十一·史传第二》引)恐怕也是想当然的说法。近人唐兰、高亨怀疑“沮诵”就是“祝融”(唐书 52 页、高亨《文字形义学概论》 27—28 页。高氏认为祝融是仓颉的官名),是否可信,尚待研究。

文字出自八卦说

这是较晚出的一种说法。

古代学者很早就认为在文字产生之前,结绳和八卦曾经起过某些类似文字的作用。一般认为作于战国晚期的《易·系辞·下》说:

古者包羲氏之王天下也⋯⋯始作八卦,以通神明之德,以类万物之情,作结绳而为罔(网) 罟,作佃以渔⋯⋯

又说:

上古结绳而治,后世圣人易之以书契。

包羲氏就是伏羲氏。“书契”据汉末郑玄注,指写有文字的木质契券。后来这个词往往用作“文字”的同义语。东汉许慎所著的《说文解字》“叙”(通“序”)文的第一段,是根据上引《系辞》文改写的。比较重要的改动是把“结绳而治”归在晚于伏羲氏的神农氏名下,并指实“后世圣人”为“黄帝之史仓颉”。不过不管是《系辞》还是《说文》“叙”,都没有直接把八卦跟文字联系起来。

《尚书》伪孔传的“序”说:

古者伏羲氏之王天下也,始画八卦,造书契,以代结绳之政,由是文籍生焉。

这篇序的作者大约是魏晋时人。他认为三皇时代就已出现文籍,所以把“造书契”这件事提早到了伏羲之世,与“画八卦”并列,同时不得不把为书契所取代的“结绳之政”推到了伏羲王天下之前。但是他也还没有直接把八卦跟文字联系起来。

据《易经》的《象传》和《说卦传》,乾、坤、震、巽、坎、离、艮、兑八卦分别是天、地、雷、风、水、火、山、泽的象征。易纬《乾凿度》进一步认为八卦就是“天”“地”等八个字的“古文”。易纬本出汉代,但是今所传《乾凿度》一般认为是宋代伪书。上引说法究竟出于何时尚难确定。如果撇开此说不管,最先明确主张“天”“地”等字出自相应卦形的,似是一些宋代学者。下面举比较有代表性的郑樵的说法略加评论。

郑樵在《通志·六书略·第五》“因文成象图”节中说:

有近取:取■(天)于■(乾体)。取■(地,亦为坤字)于■(坤体)。取■(水)于

  • (坎体)。取■(火)于■(离体)。⋯⋯有远取:取“山”于■(艮体)取“雷”于■(震体)。取“风”于■(巽体)。取“泽”于■(兑体)。

在“论便从(纵)”节中又说:

坎、离、坤,衡卦也。以之为字,则必从。故■必从而后能成“■”,■必从而后能成“火”,

■必从而后能成“■”。

郑樵显然是先有了“天”“地”等字应该出自相应卦形的成见,然后去硬加比附的。“山”“雷”“风”“泽”诸字跟相应的卦形实在太不相像,只得立了一个“远取”的名目来搪塞。近取诸例中,“天”与乾卦,“火”与离卦,其实也都并不相似。“巛”在古书中有用为“坤”字之例(《经典释文·周易音义》说“坤”本又作巛。巛,今字也。”),但并无用为“地”字之例。汉碑“坤”字作川■等形,即“巛”字所从出。王引之《经义述闻》卷一“巛” 字条,据汉碑和《玉篇》等,指出汉人借“川”为“坤”,“巛”即“川” 之变体。这是很对的。“川”字本作“■”,三笔在中部都不作尖折形,跟坤卦之形也联系不上。只有“水”字跟坎卦的确比较相似。但是八卦是由阳爻“—”和阴爻“——”组合而成的八组符号,古文字中的“水”则是个象形字,二者的相似只能认为是一种巧合。“水”字决不会是根据坎卦造出来的。古人以坎卦为水的象征,倒有可能是由于受了坎卦之形与“水”字相似

的启发。总之,“天”“地”等字出自八卦之说是完全不可信的。

清末民初的刘师培也认为“八卦为文字之鼻祖,乾坤坎离之卦形即天地水火之字形”(《中国文学教科书》“象形释例”节)。他还把结绳也扯了进来,说“字形虽起于伏羲画卦,然渐备于神农之结绳”(同上“论字形之起源”节)。这种很没有道理的说法,在当时却产生过不小的影响。

在商代和西周时代的甲骨文、金文和陶文等资料里,屡见一种用三个或六个数字组成的符号,如■(八一六)■(六一八六一一)等。近年来经过张政烺等学者的研究,证明是一种易封(张政烺《试释周初青铜器铭文中之易卦》,《考古学报》1980 年 4 期)。相传的周易卦形中的阳爻应是由数字“一”变来的,阴爻应是由数字“■”(六)变来的(参看楼宇烈《易卦爻象原始》,《北京大学学报》哲社版 1986 年 1 期)。这种爻形出现的时代, 无疑是比汉字起源的时代晚得多。从这些新的研究成果来看,文字之形出自八卦的说法的荒谬性就更明显了。

二、跟汉字起源有关的考古资料及其研究情况

在已发现的各种性质既明确、内容也比较丰富的古汉字资料里,时代最早的是商代后期(约前 14—前 11 世纪)的殷墟甲骨文。它所代表的是已经能够完整地记录汉语的文字体系。现代考古学在中国兴起以后,主要是 50 年代以来,陆续发现了少量商代前期(约前 17—前 14 世纪)的汉字以及一些跟汉字的起源可能有关的考古资料。后者主要指刻划或绘写在原始社会时期遗物上的各种符号以及被有些学者认为是夏代文字的一些符号。这些资料还不足以解决汉字起源问题,但是对这方面的研究工作起了相当大的推进作用。

根据外形上的特点,大体上可以把原始社会时期遗物上的符号分为两大类。一类是象实物之形的,一类是几何形符号。有些虽非几何形但也不像是象实物之形的符号,可以附在后一类里。下文称后一类为甲类,前一类为乙类。

原始社会时期的甲类符号

就已发现的情况来看,甲类符号绝大部分刻划或绘写在陶器上,小部分刻在龟甲、兽骨或骨器上。这类符号分布得很广,在仰韶、马家窑、龙山、良渚等文化的遗址中都有发现(参阅拙文《汉字形成问题的初步探索》,《中国语文》 1978 年 3 期。下文引作“探索”。我们所说的“遗址”包括墓地在内)。它们行用的时间也很长久。就上限来说,在距今七八千年的早于仰韶文化的大地湾一期文化遗址和接近裴李岗文化的“贾湖”遗址里,都已发现了这类符号。大地湾一期文化的符号发现于甘肃秦安县大地湾,是用颜料绘写在陶钵形器内壁上的(《文物》 1983 年 11 期 22—25 页)。“贾湖” 符号发现于河南舞阳县贾湖,是刻在龟甲等物上的(《河南舞阳贾湖新石器时代遗址第二至六次发掘简报》,《文物》1989 年 1 期)。就下限来说,这种符号不但直到原始社会末期还在使用,而且在进入历史时期以后,在汉字已经形成的情况下,仍然在某些领域延续使用了很长的一段时间。在商代以至春秋战国时代的陶器上,都可以看到不少这一类的符号(参看高明《中国古文字学通论》 36 页。甚至在某些西汉陶器上都还可以看到这类符号,参看《广州汉墓》上册 89—91、210—211 页)。

在甲类符号里,仰韶文化早期的半坡类型遗址出土陶器上的符号,时代既比较早(距今约六七千年),资料也比较丰富,因此在关于汉字起源的讨论中最受人注意。我们就以它们为例来讨论一下甲类符号跟汉字的关系。

在半坡类型各遗址中,西安半坡和临潼姜寨这两个遗址发现的符号数量最多。下面是半坡遗址发现的符号的一些例子(引自《西安半坡》197 页图141,又图版 167—171):

临潼姜寨遗址发现的符号,有不少跟半坡的相同或相似,此外还有一些形体比较复杂的例子,如(引自《考古与文物》 1980 年 3 期 15 页):

半坡类型符号一般是单个地刻在陶钵外口缘的黑宽带纹或黑色倒三角纹上的,例外很少。

对半坡类型符号的性质存在不同看法。有些学者认为它们是文字。有的并且把它们跟古汉字直接联系了起来,如认为■是“五”字,■是“七”字,

■是“十”字,■是“示”字,■是“■”字,■是“阜”字,等等(于省吾《关于古文字研究的若干问题》,《文物》1973 年 2 期 32 页)。有些学者则认为这种符号还不是文字,而“可能是代表器物所有者或器物制造者的专门记号”(《西安半坡》198 页)。还有学者认为它们只不过是制造陶器时“为标明个人所有权或制作时的某些需要而随意刻划的”(汪宁生《从原始记事到文字发明》,《考古学报》1981 年 1 期 23 页。下文引作“汪文”)。这种符号所代表的显然不会是一种完整的文字体系。它们有没有可能是

原始文字呢?恐怕也不可能。我们丝毫没有掌握它们已经被用来记录语言的证据。从同类的符号在汉字形成后还在长期使用这一点来看,它们也不像是文字(参看上引高明书 35—36 页)。把半坡类型的几何形符号跟古汉字里象实物之形的符号相比附,更是我们所不能同意的。这两种符号显然是不同系统的东西。我们不能因为前一种符号跟后一种符号里形体比较简单的例子(如草的象形符号)或某些经过简化的形式(如殷墟甲骨文里的“示”和某些“阜” 旁)偶然同形,就断定它们之间有传承关系。

但是已发现的半坡类型符号,绝大部分都刻在同一种陶器的同一个部位上,规律性很强。有些符号不但重复出现在很多个器物上,而且还出现在不同的遗址里。看来这种符号,至少是其中的一部分,很可能已经比较固定地用来表示某些意义了。除了用作个人或集体的标记之外,这种符号也有可能用来表示其他意义。

没有文字的民族往往已经知道用符号记数。我国原始社会使用的甲类符号估计也不会没有这种用途。古汉字除了使用象实物之形的符号之外,也使用少量几何形符号。■、■、■、■(四)、■(五)、■(六)、■(七)、

  • (八)、■(十)等数字是最明显的例子(数字“九”很多学者认为是一个假借字)。跟这些数字同形或形近的符号,在我国原始社会使用的甲类符号里是常见的。很多学者认为这种符号就是这些数字的前身,这是有道理的。不过这并不能证明原始社会使用的记数符号是文字。因为这种符号并不跟语言里的数字严格相对应。过去云南的哈尼族由于不会使用文字,在订立买卖契约的时候,用■、■、■、·四种符号分别代表一百元、五十元、十元和一元。要表示五元就点五个点(汪文 12 页)。这是记数符号并非文字的一个实例。

此外还应该指出一点。由于构成甲类符号的要素一般比较简单,不同地区的人很容易造出相同的符号来。这种同形的符号,其意义往往并不相同。所以虽然古汉字有些数字的外形跟半坡类型符号相同,我们仍不能得出这些数字就源于半坡类型符号的结论。它们完全有可能出自其他原始文化。

商代和西周时代(主要是西周前期)的铜器上常常铸有族徽(这里所说的族徽包括族名)。大部分族徽具有象形程度明显高于一般铜器铭文的特点, 而一小部分则跟原始社会的甲类符号很相似,例如:

它们也有可能源于这类符号(参看郭沫若《古代文字之辩证的发展》,《考古学报》1972 年 1 期 4—5 页)。原始社会里用作个人或集体的标记的符号, 是很容易变成族徽的。在商周时代,这一部分族徽符号是否已经成为文字, 还是一个问题(参看汪文 39 页)。它们的性质也许就跟后代的花押差不多。

总之,我们认为我国原始社会时期普遍使用的甲类符号还不是文字。除了有少量符号(主要是记数符号)为汉字所吸收外,它们跟汉字的形成大概就没有什么直接关系了。而且即使是那些为汉字所吸收的符号,也不见得一定是来自半坡类型符号的。有些学者以半坡类型符号为据,说汉字已有六千年以上历史。这是不妥当的。

近年在西安市郊区长安县花楼子的客省庄二期文化遗址里,发现了一些刻在骨片和骨器上的甲类符号(《陕西长安花楼子客省庄二期文化遗址发掘》,《考古与文物》1988 年 5、6 合期)。有人称之为甲骨文,认为跟殷墟甲骨文有渊源关系。这恐怕也是不妥当的。

原始社会时期的乙类符号

在田野考古中,乙类符号主要发现于山东的大汶口文化晚期遗址,一般都刻在一种大口的陶尊上。大汶口文化晚期的年代约为前 2800—前 2500 年。近年王树明在《谈陵阳河与大朱村出土的陶尊“文字”》一文中,集中发表了大汶口文化乙类符号的资料(文见《山东史前文化论文集》,齐鲁书社 1986 年出版。下文引作“王文”)。据此文,已发现的刻有符号的陶尊和残器片共有 16 件。其中 15 件是在莒县的陵阳河和大朱村采集或出土的,1 件是在诸城县前寨采集的。出土的大都出自墓葬。这些墓葬大部分有丰富的随葬品, 墓主身分似比一般人高。

16 件陶尊及残器片上,共刻符号 18 个,可以归纳为 8 种,下面每种各举一例(各种符号以拼音字母为代号,旁注数字表示出现次数):

B 是在 A 下加山形而成的。G 跟 H 上部的中间部分象同一种东西。这些符号绝大多数刻在陶尊外壁靠近口沿的部位(下文依王文称为颈部),少数刻在外壁近底处。通常一个陶尊只刻一个符号,只有两件陵阳河采集的陶尊刻有两个符号。一件颈部刻 G,近底处刻 E。一件在颈部两侧分刻 G 与 D。G 四见, 都涂朱。H 两见。完整的一例即上图所示,下部盆形是朱绘的(未刻),其他部分涂朱。残缺的一例不涂朱。他种符号各例,除诸城前寨采集陶片上残去左上部的符号 B 涂朱外(《文物》 1974 年 1 期 75 页),全都不涂朱,就是跟涂朱的 G 共见于一器时也不涂朱。

在山东泰安、宁阳二县之间的大汶口墓地的发掘中,曾在一个大汶口文化中期的墓葬中发现过一件背壶,器身上半有如下朱绘符号(《大汶口》 73 页):

这个符号跟晚期陶尊上的乙类符号是否属于一个系统,尚待研究。

上举 A—D 四例,在 1974 年出版的《大汶口》考古报告中就已发表。在70 年代有好多位学者对这种符号作过研究。1986 年发表的王文和接着发表的李学勤的《论新出大汶口文化陶器符号》(《文物》1987 年 12 期。下文引作“李文”),根据新的资料作了进一步的研究。

对这种符号的性质主要存在两种看法。有些学者认为它们是文字,并且把它们当作比较原始的汉字加以考释。例如:于省吾在《关于古文字研究的若干问题》里释 A 为“旦”(《文物》1973 年 2 期 32 页)。唐兰在《关于江西吴城文化遗址与文字的初步探索》等文中释 A 为“炅”, B 为“炅”的繁体, C 为“斤” D 为“戌”和“戉”(《文物》1975 年 7 期 72—73 页。唐氏以为“戌”“戉”古为一字)。李学勤释 B 为“炅山”合文(下文所引

《起源》155 页),F 为“封”,并指出 E 也见于甲骨文和铜器铭文,在那些资料里用作人名或族氏(李文 78 页)。有些学者则认为这种符号还不是文字, 例如汪宁生认为它们“属于图画记事的范畴”,是“代表个人或氏族的形象化的图形标记”(汪文 27 页)。此外,这两派学者里都有人主张某些符号与祭祀或器主的身份有关。

在良渚文化(?)或作风接近良渚文化的某些遗物上,可以看到跟上举大汶口文化乙类符号相类甚至相同的符号。

南京北阴阳营遗址二号灰坑曾出土一个大口陶尊,颈部刻有如下符号(引自李文 79 页)。这个符号跟上面举过的 H 很相似,似可看作同一符号的异体。据发掘单位的文章,北阴阳营二号灰坑遗存“大体与张陵山类型相近⋯⋯可能属于张陵山类型向良渚类型过渡阶段”(《文物》1978 年 4 期 52 页)。

解放前流入美国、现藏于华盛顿的弗利尔美术馆的几件古玉器,也刻有这类符号。首先注意到这批资料并加以研究的,是日本学者林巳奈夫。后来李学勤也进行了研究,其意见发表在《考古发现与中国文字起源》(《中国文化研究集刊》第 2 辑, 1985 年。下文引作“起源”)以及上引李文中。下面主要根据李学勤的文章介绍一下这批玉器上的符号(有关的图皆转引自

《起源》157 页)。

这批玉器包括一件“玉臂圈”(?)和三件玉壁。玉臂圈两侧各刻一个符号(见右图)。a 跟上面举过的 A 相同。三件玉璧上各刻一个复合符号(见下图)。这三个复合符号都以“作鸟立于山上之形”的符号为主体。其山形跟上面举过的 B 的山形一样,也有五个峰,“不过峰顶是平的”。《起源》把这个符号释为“岛”字(155 页)。c 的下部包含一个跟“臂圈”的 a 相同的符号,只是象太阳的圆圈形内加了文饰。d 的山形之内,上部有一个跟“臂圈”的 b 有点相似的符号,底部所添加的究竟是符号还是文饰不易断定。e 的山形之内也有一个符号。这个符号也许是一个甲类符号。刻有 C 的玉璧的边缘上还刻有如左图两个符号。李文已指出 f 跟上面举过的 F 是同一符号的异体(78 页)。

林巳奈夫和李学勤都认为上述玉器是良渚文化的遗物。良渚文化的年代约为前 3300—前 2200 年。大汶口文化晚期的年代正在其范围之内。这两种文化分布的地域比较接近,并有某些同类型的器物,彼 此显然是互有影响的。

所以李学勤认为“这两种文化有共同的文字联系,实在情理之中”(《起源》156 页)。他把大汶口文化乙类符号和上述玉器上的符号都看作文字,所以用“共同的文字联系”这种说法。不同意把大汶口文化乙类符号看作文字的学者,当然也不会同意把上述玉器上的符号看作文字。

近年在国内博物馆藏品中也发现了两件刻有这类符号的玉器。两件玉器都是大型玉琮,形制相类。首都博物馆收藏的一件,上端两侧面各刻一个符号。其中一个跟上举玉璧上的几个符号相类,也是以“作鸟立于山上之形” 的符号为主体的复合符号。另一个符号已磨损不可辨。李文认为这件琮属良渚文化玉琮中最晚的一式(78—79 页)。中国历史博物馆收藏的一件据传出于山东省,上端正中刻有跟“玉臂圈”的 a 相同的符号,底部内壁一侧刻有斜三角形。发表者认为此琮与“玉臂圈”应为大汶口文化遗物(石志廉《最大最古的■纹碧玉琮》,《中国文物报》1987 年 10 月 1 日 2 版。此文称“玉臂圈”为“矮筒形小玉琮”)。还有学者认为此琮是山东龙山文化遗物(安志敏《关于良渚文化的若干问题》,《考古》1988 年 3 期 241 页、245 页注(74))。由于在考古发掘中尚未发现过刻有这类符号的同类玉器,上述那些玉器究竟应该归属于哪种文化,还是有待进一步研究的问题。

我们过去曾经根据前面举出的 A—D 四个符号,断定大汶口文化乙类符号是用作族名的原始文字,并认为它们跟古汉字之间很可能“存在着一脉相承的关系”(《探索》165—166 页)。现在看来,这样说是不妥当的。正如上引汪文所指出的,“真正的文字要从表音开始,是能够记录语言的符号。陶器上这几个孤立的图形,还不能证明这一点”(28 页)。而且如果说 A—D 这几个符号确实跟古汉字很相似的话,新出的 G、H 两个符号以及玉器上的鸟立山上形符号和符号 b,跟古汉字显然就不怎么相似了。所以把这类符号看作原始文字是根据不足的,把它们直接看作古汉字的前身就更不妥当了。

估计刻在陶尊上的乙类符号可能有两种用途。有的用作性质接近后世的族氏或人名的标记,有的用作器主或其所属之族的职务或地位的标记。在同一个陶尊上出现的两个符号也许是分属这两类的。汪文说:“这些图形(引者按:指乙类符号)刻于陶器上,当是作为作器者的一种氏族标记。例如, 石斧形标记可能代表善制石斧的氏族⋯⋯”(28 页)。他说的这种标记接近我们所说的后一种标记。不过古代往往“以官为氏”,“以爵为氏”,“以技为氏”(参看《通志·氏族略》),后一种标记往往会转化为前一种标记, 二者的界线不是绝对的。玉器上的符号的用途尚待研究。

一个象形符号如果用作了性质接近后世族氏或人名的标记,从表面上看起来似乎可以认为已经变成了文字。例如一个名“鹿”的族用象鹿之形的符号(也可以说“鹿的图形”)作为自己的标记,这跟用“鹿”的象形字来记录“鹿”这个族名岂不是一回事吗?但是实际上问题并不这样简单。早在旧石器时代,只要人们已经会画鹿,就有可能指着鹿的图形说出“鹿”这个词来。我们能不能说这时“鹿”字就产生了呢?当然不能。因为这跟有意识地用鹿的象形符号来记录成句的语言中的“鹿”这个词,完全是两回事。根据考古工作者的研究来看,在大汶口文化晚期,社会的贫富分化已经相当显著, 阶级的形成已经不是遥远的事情了。在这种条件下使用的作为族或个人标记的象形符号,跟原始社会较早时期的图画当然不能等量齐观。但是在并非用来记录成句语言中的词这一点上,二者却是相同的。所以我们还不能把这种符号看作文字。

另一方面也应该看到,大汶口文化乙类符号虽然不能断定为原始文字, 毕竟是我国已发现的最像古代象形文字的一种符号。从有些符号在并非出于一地的遗物上不止一次地出现的情况来看,这种符号的稳定性显然也是相当强的。它们无疑可以看作原始文字的先驱。如果文字形成的过程接着开始的话,它们的大多数应该是会转化成文字的。大汶口文化分布的地域接近古代中国的中心地区。有些大汶口文化乙类符号的作风,跟古汉字确实很相似。看来这种符号虽然不见得是原始汉字的前身,但是很有可能曾对原始汉字的产生起过某种影响。

在这里附带讨论一下前面讲甲类符号时提到过的、商周铜器上象形程度比较高的那类族徽的性质。上面是这类族徽的一些例子。上引汪文认为这类族徽跟大汶口文化乙类符号一样,是一种“图画记事”,而不是真正的文字

(33 页)。这类族徽的确可能有相当大的一部分,早在原始汉字产生之前就已经出现。在当时它们当然还不是文字。但是汪文也承认“图画记事”中的“大部分图形成为后来文字的前身”(40 页)。在汉字形成的过程里,那部分族徽无疑大都转化成为文字了。而且象形程度较高的族徽肯定也有一部分是在汉字形成后才被使用的。这部分族徽一般都应该是文字。所以我们认为商周铜器上象形程度较高的族徽,至多只会有很小的一部分还不是文字。它们的绝大部分是没有理由不当作文字看待的。由于族徽具有保守性,同一个字在铜器上用作族徽时的写法,往往要比一般使用时更接近图形。这种区别是文字的古体与今体之别,而不是图形与文字之别。事实上铜器上的族徽的写法也不是一成不变的。同一个族徽往往有时写得比较象形,有时则写得跟一般金文比较接近。有些图绘性比较浓厚的、现在还无法确释的族徽,在殷墟甲骨文中有作为族名或人名使用的例子。它们作为文字的性质是不容怀疑的。这一点郭沫若在《殷彝中图形文字之一解》中早就指出来了(见《殷周青铜器铭文研究》)。

在一般称为族徽文字的象形程度较高的金文里,有一些字是用作个人的私名的。所以有的学者把这种金文称为记名金文,而不称为族徽金文或族名金文。我们在下文中也采用这一名称。

关于所谓夏代文字

一般认为夏代已经进入阶级社会时代。目前除少数学者外,大家都认为夏代应该有文字,至少应该已有原始文字。但是在考古发掘中却还没有发现确凿无疑的夏代文字。

在河南偃师县的二里头文化遗址里发现过一些刻在陶器上的符号,例如

(引自《考古》1965 年 5 期 222 页):

这些符号大多数刻在大口尊的内口沿上。它们大都发现于二里头遗址的三、四期地层,属于二里头文化后期。二里头文化后期,有人认为相当于商代早期,有人认为相当于夏代。持后一种看法的学者大都把上举这种符号看作夏代的文字。我们认为这种符号跟原始社会时期的甲类符号属于一个系统,不但不可能是成熟的文字,而且也不可能是原始文字。

陕西商县紫荆的二里头文化遗址里也发现过少量刻在陶器上的符号,个别的可能是象形符号。报导者认为可能是夏代文字(王宜涛《商县紫荆遗址发现二里头文化陶文》,《考古与文物》1983 年 4 期 1—2 页)。由于资料

太少,尚难肯定其性质。

河南登封县王城岗的龙山文化晚期遗址里也发现过一些刻在陶器上的符号。有的学者认为这个遗址是夏代的,并把所出陶器符号看作夏代文字(李先登《夏代有文字吗》,《文史知识》1985 年 7 期 51—52 页)。由于已发表的资料太少,其性质也难以肯定。

商代前期的文字资料

由于至今还没有发现确凿无疑的夏代以前的汉字(包括原始汉字),商代前期的汉字是已知的最古的汉字。可惜已发现的资料也很贫乏。

50 年代以来发现了不少商代前期的遗址,但是出土的文字资料却很少。在郑州二里岗和南关外的商代前期遗址里发现了一些刻在陶器上的符号(《郑州二里冈》17 页,又图 31。《郑州南关外商代遗址的发掘》,《考古学报》1973 年 1 期 83—84 页)。它们跟二里头文化陶器符号一样,大多数刻在大口尊的内口沿上,也是跟原始社会时期的甲类符号同类的东西,并不是文字。在二里岗还发现过两块字骨(《郑州二里冈》38 页,又图 30)。一块只刻有一个像是“■”的字(“■”字见于殷墟甲骨文),出自商代前期地层。一块是采集品,上面刻有十来个字,字形跟殷墟甲骨文相似,文例则比较特殊。

河北藁城县台西商代遗址里也发现过一些刻在陶器上的文字和符号,其中一部分的时代稍早于商代后期(季云《藁城台西商代遗址发现的陶器文字》,《文物》1974 年 8 期)。它们一般都是单个地刻在陶器上的,确实像文字的有“止”、“目”、“刀”等(同上 50 页,见左图)。其字体古于殷墟发现的商代后期的陶文和甲骨文。

江西清江县吴城商代遗址里发现的刻在陶器上的文字和符号,也有一些是早于商代后期的(唐兰《关于江西吴城文化遗址与文字的初步探索》,《文物》1975 年 7 期。《江西清江吴城商代遗址第四次发掘的主要收获》,《文物资料丛刊》2)。它们既有单个地刻在器物上的,也有四五个以至十来个刻在一起的。可惜后一类刻文还没有读通。吴城出土的有些陶器上的文字或符号,作风比较独特,似乎不属于商文化的系统。

在已发现的商代前期铜器里,有铭文的铜器非常少,器上的铭文通常只有一两个字。有的究竟是不是应该看作文字,还有讨论余地(参看李学勤《论美澳新收藏的几件商周文物》,《文物》1979 年 12 期 73 页;曹淑琴《商代

中期有铭铜器初探》,《考古》1988 年 3 期 247—252 页)。

总之,已发现的商代前期的文字资料又少又零碎,显然不能充分反映汉字当时的发展水平,对我们研究汉字的起源没有重大参考价值。

三、对汉字形成过程的推测

由于确凿可信的夏代以前的汉字尚未发现,商代前期汉字的资料又很贫乏,我们只能以商代后期的汉字为主要依据,参考文字发展的一般规律和某些时代较晚的原始文字的情况,对汉字形成的过程试作一些初步的推测。下面所用的古汉字一般都引自殷墟甲骨文,少量的引自铜器铭文(如“方”“圆”的古字)。在原始文字方面则引用云南的纳西族所使用过的纳西图画文字(以下简称“纳西文”)的资料(参看傅懋◻《纳西族图画文字和象形文字的区别》,《民族语文》1982 年 1 期 1 页)。

在文字产生之前,人们早已在用实物、图画或各种符号记事表意了,而且所用的各种方法跟古汉字的造字原则有很多共通之处(参看汪文 40—41 页)。所以从技术上看,文字产生的条件很早就出现了。可是文字产生的社会条件却出现得相当晚。在社会生产和社会关系发展到使人们感到必须用记录语言的办法来记事和传递信息之前,文字是不会产生的。而这种形势通常要到阶级社会形成前夕甚至阶级社会形成之后才会出现。孤立地来看似乎可以认为是跟语言中的某个词相对应的符号的出现,如上一小节所说的用作性质接近后世族氏的标记的象形符号的出现,并不意味着文字形成的过程已经开始。只有用符号记录成句语言中的词的认真尝试,才是这一过程开始的真正标志。

按照一般的想法,最先造出来的字应该是最典型的象形字,如象人形的“人”字、象鹿形的“鹿”字等。因为这一类字显然最容易造。但是实际情况恐怕并不是这样的。跟这类字相比,图画的表意能力不见得有多大逊色。唐兰在《中国文字学》里曾经引原始岩窟艺术里人射鹿的图画,跟古汉字里的“人射鹿”三个字对比(91 页,见左图)。

谁都能看出来,如果仅仅为了表示人射鹿这类意思,并没有必要撇开图画去另造文字。从后面要谈到的纳西文的情况来看,在原始文字阶段,文字和图画大概是长期混在一起使用的。对人、鹿等物和射这种具体动作的象形符号来说,文字和图画的界线是不明确的。

人们最先需要为它们配备正式的文字的词,其意义大概都是难于用一般的象形方法表示的,如数词、虚词、表示事物属性的词等等。原始文字产生之前,人们在用图画、符号等记事表意的时候,已经在使用抽象的几何图形和象征等比较曲折的表意手法了。这些方法可以用来为一部分上面提到的那些词造字。有些词的意义可以用抽象的图形表示,如古汉字最初以“□”“○”来表示“方”“圆”这两个词。古汉字里袭用原始社会时期划道道的记数方法的“■”“■”“■”“■”(四)这几个数字,其字形也可以认为是抽象图形。还有一些词的意义可以用象征等手法表示。如古汉字用成年男子的图形■表示“大”这个词,因为成年人比孩子“大”(也有人认为“大”字以张开两臂的人形表示大的意思,这也是一种曲折的表意方法)。用这些方法造出来的字虽然外形往往仍然像图画,本质上却跟图画截然有别。例如用“■”表示“大鹿”,跟画一头很大的鹿来表示这个意思,是根本不同的两种表意方法。不知道■表示“大”,就无法理解“■”说的是什么。如果把它们当图画看待,只能理解为一个人跟一头鹿在一起。鹿这类具体事物的象形符号,大概是在“大”这类跟图画有明确界线的文字产生之后,才在它们的影响之下逐渐跟图画区分开来,成为真正的文字符号的。

凡是字形本身跟所代表的词的意义有联系,跟词的语音没有联系的字, 包括前面讲过的“鹿”、“射”、“■”、“大”各类字,我们都称为表意字。显然,语言里有很多词是很难或完全不可能为它们造表意字的。上面指出过的那些难以用一般的象形方法表示其意义的词,其中的大多数,即使采用象征等比较曲折的表意手法,也仍然无法为它们造出合适的文字来。

在文字产生之前,人们还曾使用过跟所表示的对象没有内在联系的硬性规定的符号,把这种符号用作所有权的标记,或是用来表示数量或其他意义

(如前面举过的哈尼族用于记数的■和■)。原始社会时期使用的甲类符号,

显然有很多是属于这种性质的。我们姑且用一个现成的词——“记号”,作为这种符号的专称。那些难以为它们造表意字的词,是不是可以分别为它们规定某种记号作为文字呢?

在文字形成过程刚开始的时候,通常是会有少量流行的记号被吸收成为文字符号的。古汉字里“■”(五)“■”(六)“■”(七)“■”(八) 这几个数字的前身,大概就是原始社会时期用来记数的记号(参看第二小节)。但是要新造很多记号字却是有困难的。记号字的字形跟它所代表的词没有内在联系,比较难认难记,不容易被人接受。它的局限性实际上比表意字还要大得多。

要克服表意字和记号字的局限性所造成的困难,只有一条出路:采用表音的方法。这就是借用某个字或某种事物的图形作为表音符号(以下简称音符),来记录跟这个字或这种事物的名称同音或音近的词。这样,那些难以为它们造表意字的词,就也可以用文字记录下来了。这种记录语言的方法, 就是文字学上所说的假借。用这种方法为词配备的字就是假借字。假借字所用的音符严格说应该称为“借音符”,以与拼音文字的音符相区别。

从民族学资料来看,有不少还没有文字的民族,在利用实物表意的方法中就已经用上了表音原则。例如:云南的景颇族过去通行“树叶信”。他们把一些不同种类的树叶和其他东西分别用来表示某种固定的意义。在景颇族载瓦支系用来谈情说爱的树叶信中,“蒲软”树叶所表示的意思是“我要到你们那里去”,“豆门”树叶所表示的意思是“你快打扮起来吧”。因为在他们的语言里,当到达讲的那个词跟树名“薄软”同音,当打扮讲的那个词跟树名“豆门”同音(汪文 5—6 页)。看来表音原则早在文字出现之前就已经普遍为人们所熟悉了。

前面已经说过,最先需要为它们配备文字的那些词,有很多是难以用表意的造字方法来对付的。人们无疑很快就会发现可以用自己本来就熟悉的表音原则来解决面临的问题。所以,跟图画有明确界线的表意字的开始出现和假借方法的开始应用这两件事,在时间上不会有什么显著的距离,大体上应该是同时发生的。■在古汉字里有大量假借字,而且有很多是用来记录极为常用的词的。例如常用的语气词“其”,就是用音近词“箕”的象形字来记录的。在纳西文里,使用假借字的情况跟古汉字差不多。例如“有”这个常用词,就是用音近词“芜菁”的象形字来记录的。这种现象说明假借字的历史一定非常悠久。在文字形成的过程中,表意的造字方法和假借方法应该是同时发展起来的,而不是像有些人想象的那样,只是在表意字大量产生之后, 假借方法才开始应用。

前面曾经指出,跟图画有明确界线的表意字的产生,有助于使那些本来跟图画分不出明确界线的象形符号,逐渐跟图画区分开来,成为真正的文字符号。假借方法也能起这样的作用。那些性质还不明确的象形符号如果经常跟假借字放在一起使用,或是被假借来记录跟它们所象的事物的名称同音或音近的词,就会较快地成为真正的文字符号。在这一小节开头我们曾说过, “用符号记录成句语言中的词的认真尝试”是文字形成过程开始的真正标志。根据以上的讨论我们可以进一步说,跟图画有明确界线的表意字和假借字的出现,是文字形成过程正式开始的具体标志(参看汪文 42 页)。

假借方法的普遍应用大大提高了文字记录语言的能力。但是假借字多起来以后,又出现了新的问题。被假借的字原来有自己所代表的词,同时又被

假借来记录同音或音近的词,而且假借它的词可以有好几个。因此阅读文字的人有时难以断定某一个字在某一具体场合究竟代表哪一个词。

为了克服假借所引起的字义混淆现象,人们把有些表意字或表意符号(以下简称“意符”)用作指示字义的符号,加注在假借字上。例如:在殷墟甲骨文里,“翼”的象形字■(象鸟或虫的翼),在假借来表示当明天讲的“翌” 这个词的时候,有时加注“日”字,写作■。在纳西文里,“蕨菜”的象形字■在假借来表示同音词“小官”的时候,往往加注端坐人形而写作■。这种由表音的符号和指示字义的符号一起组成的字,就是文字学上所说的形声字,表音部分称为声旁,表意部分称为形旁。

人们为了使文字跟它们所表示的词的联系更为明确,一方面在一些被假借的字上加注形旁,另一方面还在一些表意字上加注音符。例如:在殷墟甲骨文里,“凤”字本作■,象高冠(?)美羽的凤鸟,后来加注音符■(凡) 而成为■(“凤”“凡”古音相近。大约在周代,凤鸟形简化为“鸟”旁, “凡”旁移到上方,就成了“凤”的繁体“鳳”)。在纳西文里,“山崖” 写作■。纳西语当山崖讲和当鸡讲的那两个词同音,所以在山崖的象形符号上加画一个鸡头作为音符。过去的文字学者把在象形字上加注音符而成的字看作象形字的一种特殊类型,其实还不如看作一种特殊的形声字合理。

形声字起初都是通过在已有的文字上加注指示字义的意符或音符而产生的。就汉字的情况来看,直到它已经成熟之后,这仍然是形声字产生的主要途径。

形声字的应用大大提高了文字表达语言的明确性,是文字体系形成过程中一个极为重要的步骤。但是这件事似乎并没有很快导致文字体系的最后形成,已经使用形声字的纳西文就是一个例证。

下面是引自丽江纳西族经典《古事记》的一段原始文字(据傅懋◻《丽江么些象形文“古事记”研究》,武昌华中大学 1948 年版 29 页):

■表示拿蛋。■本是“解开”的表意字,在纳西语里当“解开”讲和当“白”讲的那两个词同音,所以这里假借它来表示“白”。·是“黑”的表意字。■是风。■是蛋。■是湖。■表示蛋破发光。最右边是上文已经提到过的“山崖”的形声字。据纳西族经师的解释,这段原始文字的全部意思是: 把这蛋抛在湖里头,左边吹白风,右边吹黑风,风荡漾着湖水,湖水荡漾着蛋,蛋撞在山崖上,便生出一个光华灿烂的东西来。在这段原始文字里,虽然已经使用了假借字和形声字,但是很多意思仍然是用图画手法表示出来的。

汉字一定也经历过跟纳西文相类的、把文字跟图画混合在一起使用的原始阶段。不过二者的具体情况肯定会有较大的不同。纳西文主要是用来帮助经师记忆经典的,所以图画的成分很多。原始汉字当然不会长期停滞在这种阶段。

在殷墟甲骨文里可以看到接近图画的表意手法的一些残余痕迹。其中比较突出的一点,就是某些表意字往往随语言环境而改变字形。例如:甲骨卜辞里时常提到商王对祖先举行进献食品的“■”祭(“■”在典籍里多作“登”。

《周礼·夏官·羊人》“祭祀割羊牲,登其首”,郑玄注“登,升也”)。甲骨文“■”字作■,象两手捧着一种叫做豆的盛食器皿。如果卜辞提到的

■祭所用的食品是鬯(一种香酒),“■”字往往改写为“■”,两手所捧

的“豆”换成“鬯”。卜辞里既有“■鬯”之文,又有“■鬯”之文,看来“■”仅仅是“■”字有特定用途的一个异体。但是在汉字发展的较早阶段

(这里所说的“汉字”包括原始汉字),情况恐怕并不如此简单。纳西文在这方面可以给我们一些启发。在纳西文里,字形随语言环境而变化的现象很常见。例如“吼”字通常写作■,象牛嘴出声气,如果说到“马吼”,通常就把这个字里的牛头换作马头,并不需要另加一个“马”字。在汉字发展的较早阶段,“■”也应该是用来表示“■鬯”的。到商代后期,这种比较原始的用字习惯基本上已经被抛弃,“■”字则作为“■”的特殊异体而保存了下来。类似的例子在甲骨文里还可以找到一些。此外,文字排列方式跟语言中的词序不完全相应的现象,在甲骨文里偶尔也能看到。这些都可以看作古汉字曾经经历过把文字跟图画混在一起使用的原始文字阶段的证据(参看

《探索》168—169 页)。

在形声字出现之后,原始汉字大概还经过了多方面的改进,才最后发展成为能够完整地记录汉语的文字体系。估计在不断增加新字的同时,至少还需要进行这样一些改进:逐渐摒弃图画式表意手法,简化字形并使之趋于比较固定,使文字的排列逐渐变得与语序完全一致。

对汉字的形成过程目前只能作以上这些很初步的推测。

附带说一下,在古埃及的圣书字和古代两河流域的楔形文字等古文字体系里,也可以看到表意字、假借字和形声字这几种性质的文字。由于汉字跟这些古文字体系都具有兼用意符和音符的特点,有的学者称它们为意符音符文字,简称意音文字。

四、对汉字形成时间的推测

由于缺乏资料,对汉字形成过程从何时开始的问题,目前还无法进行认真的讨论。我们在第二小节里曾推测大汶口文化晚期(约前 2800—前 2500 年)的乙类符号有可能曾对原始汉字的产生起过某种影响。按照这种推测, 汉字形成过程开始的时间可能在公元前第三千年的中期。

下面我们来讨论汉字大约在什么时候脱离原始文字阶段而形成完整的文字体系。由于前面屡次讲到的研究资料的局限性,我们只能主要根据商代后期汉字的发展水平来推测汉字形成完整体系的时间。

商代后期的汉字不但已经能够完整地记录语言,而且在有些方面还显得相当成熟。前面已经说过,商代的记名金文情况特殊,象形的程度比较高。一般的金文和甲骨文跟这种金文相比,写法要简单得多(参看第二节的第二小节里讲商代字体变化的部分),不少字已经变得不大象形了。有些字还由于文字直行排列的需要,改变了字形原来应有的方向,例如■(犬)、■(豕) 等字都已变得足部腾空,■(疒,即疾字初文)所包含的人形和床形也已经竖了起来。当时,在上层统治阶级的政治和社会生活里,文字已经使用得相当广泛,为他们服务的史官一类人的书写技巧也达到了很高的水平。从这些方面看,商代后期距离汉字脱离原始文字阶段而形成完整文字体系的时代, 应该已经有一段不太短的时间了(参看董作宾《中国文字》、《中国文字在商代》、《从么些文字看甲骨文》等文,皆已收入《董作宾先生全集》乙编第 4 册)。

但是另一方面,在商代后期文字里仍然可以找到一些比较原始的迹象,

例如前一小节提到过的,某些表意字随语言环境而改变字形,以及文字排列偶尔跟语序不相应等现象。这些现象在西周以后的汉字里基本上已经绝迹。从这方面看,商代后期距离汉字形成完整文字体系的时代似乎也不会很远。

《尚书·多士》记载西周初年周公对商朝遗民的训话说:“惟尔知,惟殷先人有册有典:殷革夏命。”周公特别强调殷的先人有典册记载“殷革夏命”之事,也许我国就是从夏商之际才开始有比较完备的记事典册的。汉字形成完整的文字体系,很可能也就在夏商之际。前面说过,原始汉字可能开始出现于公元前第三千年的中期。大约到这一千年的末期,夏王朝建立了起来,我国进入了阶级社会时期。统治阶级为了有效地进行统治,必然迫切需要比较完善的文字。因此原始汉字改进的速度一定会大大加快。夏王朝有完整的世系流传下来这件事,就是原始汉字有了巨大改进的反映。汉字大概就是在这样的基础上,在夏商之际(约在前 17 世纪)形成完整的文字体系的。有的学者主张汉字形成于夏初(孟维智《汉字起源问题浅议》,《语文研究》1980 年 1 期 106—108 页)。由于大家都缺乏确凿的根据,究竟谁是谁非, 只有留待发现有关的新资料以后再去判断了。还有学者认为“中国象形文字出于商代后期(盘庚、武丁以后)的卜人集团”(徐中舒、唐嘉弘《关于夏代文字的问题》,中国先秦史学会编《夏史论丛》127、140 页)。这未免把汉字形成的时间估计得过晚了。

在汉字由原始文字发展成为完整的文字体系的过程里,起主要作用的应该是为部落首领或国家统治者服务的巫、史一类人。汉代人说仓颉是黄帝的史官,未必有可靠的根据,但是把史官当作造字的人还是有点道理的。