作为世界上最大的公开汉字字源数据库之一,汉字字源Chinese etymology”网站(https://hanziyuan.net/)收录了近10万个古代中文字形,6552个最常用现代汉字字源分析,31876个甲骨文,24223个金文,以及秦汉大篆书11109个、小篆体596个……而这个数据库的创建者竟然是一位美国人——理查德·西尔斯(上图)。22日,70岁的理查德·西尔斯在南京创新周开幕式上荣获“金陵友谊奖”。
通讯员 栖宣 摄制 许倩倩
扬子晚报/紫牛新闻记者 姜婧仪
将汉字数字化是他最想做的事
1950年,理查德·西尔斯出生于美国西部的俄勒冈州,拥有物理学学士和计算机硕士学位,后来对东方文化产生了浓厚的兴趣,22岁只身来到了中国台湾希望学习汉语。和词汇、语法比起来,汉字笔画繁多且复杂多变,死记硬背只会令人痛苦不堪。在摸索的过程中,他发现如果理解汉字的象形来源,便可以很容易掌握汉字,于是他开始了漫长的汉字故事探索。
而使他真正下定决心做汉字资源数据库,是1994年的一天。正在和朋友聊天的西尔斯突发心脏病,手术后,他的心脏中多了四个搭桥、三个支架,医生告诉他生命或许只剩下了最后一年。接近死亡的时候,他决定做自己一直以来想做却还没有行动的事:将《说文解字》数字化。
为10万个古汉字找到“前世今生”
为汉字字源建立一个数字化网站,这在上世纪90年代是未曾有人探索的空白领域。此外,汉字的数字化是一项极其浩大的工程,《说文解字》中古汉字一万一千字、《六书通》三万八千字、《金文编》两万四千字、《甲骨文编》三万一千字。为建立十万多字的古汉字数据库,西尔斯在唐人街租了一间屋子,雇了一位中国助理帮忙扫描,每年需要支付对方12000至15000美元的薪酬。为了找到尽可能全面的汉字字源,他经常飞往中国求购汉字的相关研究材料。汉字古籍价格不菲,西尔斯几乎将自己全部的工作收入都投入到了汉字网站的建设中,甚至多年来存下的30万美元积蓄也几乎花光。
经过近10年的不懈努力,汉字字源网网站(Chinese Etymology)于2002年公开上线了。网站展示了西尔斯搜集的近10万个古代中文字形,登录这个中英文双语网站,任意输入一个汉字就可以找到这个汉字的“前世今生”,查到每一个汉字的演变过程。
被中国网友称为“汉字叔叔”
也在2002年,美国经济危机让他失去了硅谷的工作,西尔斯只寻到了一份河道管理员的工作。2007年他彻底失业,再也无力支付助理薪酬。即使这样,为了保持网站的纯净,他拒绝接受商业广告的入驻。不得已,他在网站开通了捐赠功能,“我从1994年开始自费研究古汉字。请捐款,这样我可以继续汉字研究,持续免费提供这些内容,并且没有广告干扰。”然而,他一年最多只能收到50美元的捐款,这些远远不够维持网站的运营。
直到2011年,一位中国网友发现了西尔斯的网站,忍不住发了一条这样的微博:“这个人叫Richard Sears,他用20年的工夫,手工将中国甲骨文、金文、小篆等字形,数字化处理,上传网络供所有人免费使用。”接下来的一个月,这条微博被不断转发,他被中国的网友们亲切地称为“汉字叔叔”,网站点击量达到了60万次。
如今,70岁的西尔斯表示,下一步打算深入研究字形构件的演变。