汉字的历史故事(3)
汉字的历史故事
汉字的历史故事之中国传统的语言研究
中国传统的语言研究叫做“小学”,这颇为发人深省,因为其对应的是处理社会政治主题、更宏阔的所谓“大学”。前佛教时期的小学——始于公元前数个世纪——几乎完全以汉字为中心,而对于语言本身一无所涉。(在现代标准汉语中,由于受日本的影响,大学的意思是university,小学则用来指primary school。)正是佛教,说服了不情愿的中国知识界在他们珍视的汉字之外,对口语也给予应有的关注。不过直到二十世纪之前,中国传统的语言研究都还在很大程度上聚焦于汉字,对口语只偶尔投以一瞥。
模仿日语中しょうがく和だいがく的对应汉字,小学的意思变成是primary school,大学用来指university——这一事实指向现代汉语词汇形成过程中一个非常有意思的方面。即,数以百计有其原初意义的重要词汇(特别是在科学、文化、社会学、经济学和教育领域),在前现代时期从汉语借用到日语中,然后这些词汇被日语赋予新的意义(通常在西方启发下),最终带着新的词义又回借给汉语。这种“往返词”包括了文学、文化、文明、语法、词汇、物理学、铅笔、演讲、讽刺、学士、博士、艺术、决心、具体、安全、封建、方面、法律、模特、保证、表达、观念、意义、自由、阶级、改革、革命、环境、课程、计划、经理、经济、权利、自我批评、机械、机会、机体、抗议、讲义、故意、公司、结构、教育、教授、共和、劳动、理解、流行、政治、社会、进步、信用、支持、思想、自然、方法、宗教、主席、便当、投机、预算、运动、游击,等等。(其中特别有意思的一个词汇是China在汉语中的对应词“支那”。China来自于秦朝的chin,后被梵语借用为Cīna,而最晚到唐代,这个词又回译为汉字“支那”,并远渡重洋到了日本。所以,“支那”基本上是一个“二度往返词”。“支那”这个词现在在中国是禁止使用的,因为在二战时被日本官兵所污,除了有些学者出于特殊历史效果仍偶尔使用它。)现代汉语词汇中更大的一个子类(用来对应英语中具-ology和-ism词尾的词汇)也是最初为日语所生造出来以对应西方概念,后来又为汉语所借用。与以上列举的“往返词”不同,这类词汇在汉语中原来并不存在。
对汉字的首次彻底考察是许慎的《说文解字》,这部完成于公元100年的作品至今仍作为与汉字有关事物的“福音书”而被频频征引。许慎将所有汉字分为六大类:
1.“指事”,属表意文字;
2.“象形”;
3.“形声”,形声字包含一个声旁和一个形旁,大多数汉字属于这个类别;
4.“会意”,字义由其组成部分的合义构成(如仁,言,信)。这是一个错谬的类别,因为实际上并没有哪个汉字是起源于这种方式;
5.“转注”,这是一个晦涩的类别,它试图解释人们所认为的具有近似形状而相互之间轻微变形的汉字。有些成对的汉字之间具有非常微小的字形区别;
6.“假借”,这个类别涵盖的是同义词,同义词在金文中相对突出。
以许慎“六书”为代表的汉字研究一般被认为是中国的词源学。实际上,严格而系统化的汉语词源科学从未在中国建立起来。而词源学的基本内容——最早的使用以及词形词义的变化,告诉我们真正的词源学处理的是词的源流和演变。它包括词根和词素的语音语义分析,以及它们在不止一个词根的词汇中的结合。词源学关涉的是词的源流与演变,而非字的演变。中外学者正在合作编写一部中文的词源学词典,将于二十一世纪问世。
《说文解字》的另一处瑕疵在于,即使是它的汉字研究也只以年代追溯到公元前三世纪左右的小篆为基础。小篆与之前的金文、甲骨文有长达千年的时间距离。结果是许慎对汉字字形的解读经常是严重错误的。由于未能意识到字从起源时到他所处的东汉,其间会发生何等巨大的语音转变,许慎有时在分析字的发音时会谬以千里。虽然有这么多不足,许慎还是被追认为中国的语言研究(更精确的应该是汉字研究)创始人,他的《说文解字》也成为后世这一领域著作的标杆。
许慎的最伟大贡献之一在于他抓住了如何给数千汉字排序这一至今让信息专家头疼不已的重要问题。许慎的解决方案是创立540个形旁部首,然后将所有现存汉字分门分类在540个部首之下。到了清代的《康熙字典》,部首慢慢削减为214个(其排序法实际上早在明代的1615年已由梅膺祚所创立)。当我们考虑到如下事实,才能充分理解这一体系令人生畏之处:一、一个汉字可能包括两个、三个甚至更多部首,这让人很难确定它到底属于哪个部首(比如只有九画的“章”字,却有不少于五个可能的部首);二、因为有要将它放进汉字的方块形状中这一削足适履的习惯,部首很可能会以变形的面貌出现;三、即便成功辨别某字的“正确”部首,一个部首之下有可能会包括数百个汉字,这便又提出了一个如何给部首之下的汉字逻辑排序的复杂问题。(通常的方法是根据减去部首之后的剩余笔画排序,但实际笔画数有时候也是模棱两可的,同时如在“木”或“心”部首的七画下,会超过一百个汉字。)除了用许慎发明的部首法查字带来的困难之外,部首分类法的存在还或多或少排除了汉字逐渐演变为语音文字的可能性,因为这一分类强调所有包含一个以上成分的汉字(绝大多数汉字)都能这样进行分析,这样它们就能被视为包含一个语义成分——不管被分配的语义是否在该词的词源学演变中确有其事。
如何排列(反过来就是如何查找)数万个汉字这样一个头疼的问题,导致产生很多其他方法。中国传统的类书经常根据名词概念(如天、地、人、岁时、鸟兽或者草木)来组织。而在吸收了印度音韵学之后,汉字开始根据音律这一高度技术化的体系来分组,一共出现过数百种排序和查找汉字的其他方法(四角法、上下笔画法和笔画顺序法等)。大多数方法发明于急迫追求效率的二十世纪,此时的中国词典编纂者面临着前所未有的国际经济和文化竞争压力。汉语使用者越来越发现拼音是最简易快速的检字方法。(这一点从图书馆词典中拼音检字表的污损,以及非专业打字员的一般电脑使用者的输入习惯那里得到证明。)对所有词汇(单音节、双音节以及多音节)来说,完全的字母音序排序正在成为比首字排序更受欢迎的方法。在词典编纂领域和信息以及计算机科学领域都是如此。
除了《说文解字》,中国传统的语言研究中另一部标杆性著作是东汉刘熙的《释名》(约200)。《释名》的主要分析技术是“声训”,就是用声音相同或相近的字来解释词义。于是基本上,它试图用双关法来解释词汇的起源与关联。虽然这让《释名》多少具有音律研究方面的价值,但是对于词义和词源研究而言,就很难采信。
概括一下本节以及前两节的主要观点:汉字既非完全语音,也非完全语义。只有通过其语音部分和语义部分的结合,汉字才成其为汉字。汉字的这一典型双重特性使之在世界现存通行文字中独一无二,这对于艺术和文学都具有重要意义。