·我们要做一个全东亚人的遗传谱系树,先把每一个古代人的DNA挂上去,每个人都是树上的一片叶子,这些人会像吸铁石一样,吸引公众参与,建立现代人与古代人的联系,这就是我们中华民族的“大家谱”。用DNA做家谱,这是一件很酷的事情。
·有了更多的基因数据之后,又反过来有利于我们再去攻克现代人类疾病。当然,这一切需要有很好的伦理监督。
右:公元572年中国古代政权地图;左:阿史那皇后墓地、墓志和印章。文少卿 供图
近日,复旦大学科技考古研究院青年副研究员文少卿很兴奋地告诉澎湃科技记者:“最近有一波重大发现,我们获取了突厥、鲜卑、西夏皇族的基因组,破解了他们的祖源之谜,阿史那皇后基因组研究的文章最近就能发表,这个基因组是全球古突厥皇室的首例,也是中国古代名人的首例。”
11月19日,文少卿团队一篇题为“Ancient Genome of Empress Ashina reveals the Northeast Asian origin of G ktürk Khanate”的论文,已被中科院一区中国大陆SCI期刊《Journal of Systematics and Evolution》接收。
阿史那皇后(551年-582年),突厥木杆可汗之女。当时的中国北方,东边是东魏北齐,西边是西魏北周。起初东强西弱,西魏北周和突厥交好,打算通过联姻巩固这层关系。东边知道后,也去求婚,于是突厥可汗打算毁约,待价而沽。北周多次派遣使者去突厥邀约,使臣带着迎亲队伍在那里待了数年,都没有结果。后来历经磨难,三年后(568年)才来到中原。史书说,阿史那皇后容貌美丽,举止有法度,北周武帝宇文邕对她十分敬爱。更重要的是,突厥兴火葬,大墓中能够留下身份明确的骨骸非常难得。因此,阿史那皇后的样本是追溯突厥源流史的重要材料。
关于突厥阿史那部的祖源,学界有三个假说。一说是匈奴之后,属于欧亚大陆东北亚起源;二是欧亚大陆西部起源,说是在西海之右,甚至最夸张的说法认为西海是地中海;三说为东西混合说,即在中国西北地区由东西方人群混合而成。
文少卿团队本次研究的最大突破,就是明确了阿史那部的祖源。文少卿告诉澎湃科技:“从我们测得的数据来看,明确了突厥阿史那部起源于欧亚大陆东北亚,即今天的中国东北到俄罗斯贝加尔湖区域,否定了欧亚大陆西部起源说和多重起源说。另外,阿史那氏与铁器时代以后的通古斯(阿尔泰语系的三大语族之一)和蒙古语游牧人共享更多的基因,如柔然(中国古代游牧民族之一)、鲜卑、契丹、黑水靺鞨(唐代东北部族名),与其他古突厥人有显著的遗传差异,显示了突厥汗国内部的多重来源。最后,突厥阿史那部对现代突厥语人群的遗传贡献非常有限,再次确定了突厥语为文化传播模式,而非人群扩张模式。”
黄色代表西欧亚祖先相关成分,紫红色代表东北亚祖先相关成分,蓝色代表东亚祖先相关成分。阿史那皇后与蒙古高原人群的组成相似,主要由东北亚来源(紫红色)的遗传成分构成。文少卿 供图
2022年10月4日,瑞典生物化学家、进化遗传学权威斯万特·帕博获得“2022年诺贝尔生理学或医学奖”,令古DNA研究这一冷门绝学走进大众视野。
当日,澎湃科技记者专访进化遗传学家、复旦大学校长金力院士,对古DNA研究有了更深入的了解。金力告诉澎湃科技,在上海,有一位年轻的80后研究员,在系统地做古DNA研究,“我看他能坚持下来。”金力说。
文少卿告诉澎湃科技:“我肯定可以坚持下去,因为喜欢。”
文少卿第一次接触古DNA,还是2014年读硕士的时候。当时,文少卿的师兄在做“曹操谱系研究项目”,他们通过安徽亳州曹操叔祖父曹鼎牙齿的DNA片段,确定了曹操家族的遗传密码,不仅找到曹操的疑似后人,也找到了一种联用现代与古代DNA锁定名人遗传谱系的方法。“那时候项目留一个尾巴,当时曹鼎的遗传类型是根据STR遗传标记推测的,我当时干了一件事,通过残留的古DNA直接证实了曹鼎的父系类型。非常幸运,一次就成功了,我觉得我比较适合干这行,就义无反顾的转入了古DNA研究。”
如今的文少卿,依然保持着每天10点到实验室,凌晨两三点回家的作息节奏。他说,科研会上瘾。
近日,就阿史那皇后的研究成果,以及更大的研究设计版图,澎湃科技找文少卿深入聊了聊。
对话:
澎湃科技:帕博得诺奖后,让古基因组学走进大众视野,对很多人都是一次非常突然的科学普及。澎湃科技采访金力校长后,才知道做古DNA研究有多难。
文少卿:古DNA或者古基因组学领域,它也是分阶段的。一方面随着生物技术的发展,从基于分子克隆阶段,到基于PCR阶段,到目前的基于高通量测序阶段,最终形成了古基因组学。前两个阶段的古DNA研究一度走入绝境。污染与结果真实性的质疑一直伴随着学科的发展。另一方面,研究者的兴趣也不同。有的研究者主要想解决古人类的演化问题,比如早期智人、晚期智人,特别是现代人类的起源问题,以及现代人与古人类混血的细节问题,比如与尼安德特人、丹尼索瓦人。帕博主要聚焦做这一块, 他写过一本书——《尼安德特人》,有中文译本。
澎湃科技:人类起源感觉是一个很宏大的问题。
文少卿:对考古学来说,有三大终极问题。一是人类起源问题,就是之前说的帕博关心的问题。二是农业起源问题,农业起源是人类社会发展的转折点。农业的发展为人口指数级的增长提供支撑,人类由狩猎模式变为定居模式,人口密度增加、动物被驯化后与人类空间距离的缩小,导致各类传染病的增加,又反过来作用于人类的演化。三是文明起源的问题,由氏族进入有国家组织的阶级社会,我们更关心用基因数据讲述族群的形成发展史。这些都是很核心的问题。
像金力老师的工作,就是群体的“源流”问题。他不但关心“源”,更关心“流”。比如,古人是如何演化成现代人的,现代人又如何适应环境,融合发展成现代族群的。金老师近年来做的表型组学,又进入到一个新的领域,他关心那些独特的表型,是如何通过环境和基因的相互作用形成的。
澎湃科技:这样看来,你这次做的“阿史那皇后”基因组的研究,似乎就是个“流”的问题,她可能直接关系到中国这些古代民族是怎么形成的。是什么让你走向这个研究?
文少卿:研究这件事,不能盲目跟风,不能看到帕博通过古DNA研究古人类,研究人类起源,我们也去做这个领域,要结合我们所在的这片土壤,将个人的兴趣和国家战略需求相结合。在我看来,我植根的土壤就是复旦和中国。
你知道,复旦的优势在中国史、古文字、语言学、遗传学等,复旦有很强的文史积淀和跨学科基础。从国家角度来讲,通过分子考古的手段,除了论证现代人起源这个“源”的问题,更重要的是探究中华民族的形成和发展问题,帮助我们讲好各民族间你中有你、我中有你的血肉联系是如何形成的,“流”的问题更重要。我做的阿史那基因组的研究,依托的是复旦历史系韩昇教授“三到九世纪北方民族的谱系研究”的社科重大课题,课题涉及匈奴、突厥、鲜卑、吐谷浑和粟特人的遗传谱系研究。
澎湃科技:帕博的诺奖让我们知道,做古DNA研究,得先有骨头样本。阿史那的样本,你怎么得到的?怎么确保她真的是阿史那皇后呢?
文少卿:1994年陕西考古所对北周武帝孝陵进行了抢救性发掘,2018年我博后时期,陕西考古所联系我们采集了这一批样本,拿到了北周武帝皇后阿史那氏和北周武帝宇文邕的肢骨样本,这两个个体的骨骼样本保存质量不是很好。在文献记载中武帝宇文邕是鲜卑族人,皇后阿史那氏是突厥木杆可汗阿史那俟斤的女儿,对研究民族融合有很大的价值。出土的考古信息非常全面,阿史那皇后的身份没有问题。
澎湃科技:所以接下来就是不停地测测测吗?据说这个过程非常烧钱。
文少卿:是的,现在即使是做现代人的全基因组测序,一个样本也要几千元。而从古人遗骨中提取到的基因片段里,99%属于环境微生物,比如真菌、土壤微生物等,只有1%不到是人类基因,提取这1%需要样本保存情况较好时才能成功。打个比方,做古代人的基因检测,测100条只能得到1条或许有效,这样来说,成本就是现代人的99倍。
澎湃科技:所以就因为这个,从2018年拿到样本,到今年论文发布,花了那么长时间?
文少卿:卡脖子、卡脑子,甚至研究中途发生方向性改变的小插曲,没间断过。就举个卡脖子的例子吧。测有效DNA相当于大海捞针,这需要一张“网”,来捕获古代目标片段,单单编制这张“网”就要几百万。还有一种通过PCR直接扩增的方法,模拟体内DNA的天然复制过程在体外扩增DNA分子,主要用于扩增位于两段已知引物之间的DNA区段。但这种方法只涉及有限的点位,不能给我们更多关于样本的细节信息。我们拿到样本,总希望能得到更多细节信息,用PCR这种方式,相当于是给了你鲍鱼的材料,你就随便炒了一吃,会觉得很可惜。就这一个原因,把我们卡住很长时间。
澎湃科技:卡脑子的例子有没有?
文少卿:有啊。阿史那氏的检测数据出来以后,我想尽可能了解关于阿史那部的故事,比如,阿史那部的祖先是从哪儿来的,当时的突厥汗国分布那么广,突厥内部是什么关系,以及核心部众人群的基因流向,这些都是很核心的问题。因此就需要求教历史学、考古学的研究者,共同参与设计实验,提出科学问题。此外,分析细节需要适用于古DNA分析的算法,当时国内还没有成熟的高通量古DNA数据流程,我们需要自己一步步的搭建起来。
澎湃科技:这单靠阿史那皇后一个人的基因组,很难解决吧?
文少卿:解决不了,这也是卡脖子的地方。我们得到的是一个基因组,但是要讲明白古突厥的源流,还需要大量现代人的数据,以及同时期其他突厥人的数据,甚至更早期古代族群的样本数据,再运用各种算法和分析手段,这个项目才可能做到你理想中的样子。
在这个数据积累的过程中,近年来国外的团队已经建立起了蒙古国、东北亚、中亚的古代族群的古DNA基因数据库;金力老师团队也一直在积累东亚现代人的数据。这些古DNA数据可以帮助我们解决阿史那部“源”的问题,而现代北方汉族、阿尔泰语系下的突厥语、蒙古语、满-通古斯语人群的基因数据可以揭示阿史那部“流”的问题,阿史那皇后的基因数据恰好是突厥阿史那部演化历史的关键拼图。
澎湃科技:你们发现了什么?
文少卿:关于突厥阿史那部的祖源,学界有三个假说。一说是匈奴之后,属于欧亚大陆东北亚起源;二是欧亚大陆西部起源,说是在西海之右,甚至最夸张的说法认为西海是地中海;三说为东西混合说,即在中国西北地区由东西方人群混合而成。
从我们测得的数据来看,明确了突厥阿史那部起源于东北亚,即今天的中国东北到俄罗斯贝加尔湖区域,否定了欧亚大陆西部起源说和多重起源说。另外,阿史那氏与铁器时代以后的通古斯(阿尔泰语系的三大语族之一)和蒙古语游牧人共享更多的基因,如柔然(中国古代游牧民族之一)、鲜卑、契丹、黑水靺鞨(唐代东北部族名),与其他古突厥人有显著的遗传差异,显示了突厥汗国内部的多重来源。最后,突厥阿史那部对现代突厥语人群的遗传贡献非常有限,再次确定了突厥语为文化传播模式,而非人群扩张模式。
将阿史那氏与欧亚大陆已发表的群体两两一组分别进行比较并计算,该群体与阿史那氏的遗传距离越近,在图中的颜色越趋向于红色。文少卿 供图
澎湃科技:她丈夫北周武帝宇文邕的基因组,有什么发现吗?
文少卿:也有很重要的发现。他的基因组与现在已发表的疑似鲜卑文化样本的基因组是比较接近的。宇文邕属于宇文氏,比对鲜卑拓跋氏和慕容氏的基因数据,发现他们的遗传构成都比较接近,属于东北亚起源,这与突厥内部差异较大不同。更有意思的是,宇文邕本人还有北方黄河流域成分,接近30%,算是很高了,这就可以看出中华民族的形成过程,鲜卑贵族阶层汉化的比例挺高。
澎湃科技:除了这些人文历史方面的发现,还有什么误打误撞的发现吗?
文少卿:我之前说,有时候,一些发现会把我们带到另一个方向去。我们在做宇文邕遗骨测试的时候,在DNA提取过程中,试剂加进去以后颜色变红了,很奇怪,我们从来没有见过这种现象。当时采样的时候,陕西省考古研究院的张建林老师跟我们说,武帝会不会是中毒死的?所以我们就跟陕西考古所的老师联系,通过对武帝棺椁、随葬品做系统的采样,看看北周武帝会不会是被毒死的。
查阅历史文献后我们了解到,他发兵准备攻打突厥后没多久就死了,那么,有没有可能宇文邕是被阿史那皇后毒死来阻止他去攻打突厥?我们继续做元素分析,发现他的砷元素是正常人的100多倍,那肯定是中毒死的,但是,究竟是急性中毒,还是慢性中毒呢?
我们一方面查阅更多文史资料,一方面找做医学的人合作,医学方面的老师告诉我们,如果是急性中毒,砷超标会集中在腹腔区域,而我们是在肢骨中测得了砷元素超标,所以只能是慢性中毒。复旦大学历史系韩昇教授通过各类文献,发现宇文邕豢养了一些术士为自己修炼丹药,这样一来就解开了宇文邕砷超标的谜团。但有趣的是,宇文邕在历史上一直是灭佛灭道的先锋。
这一发现,倒是让我们在科技考古之下,形成了古代毒理学研究的新分支。这很有意思,很多学科或者新兴方向都是这么形成的。
澎湃科技:这些研究,跟我们这些现代人类,还可以有什么关系?
文少卿:古DNA除了做人类进化的研究之外,还能解释一些医学上比较根源的问题。比如,在磨沟遗址,我们找到很多麻风病和结核病的样本,结合现代临床的基础测序数据,就可以去判定古人所患的疾病及其演化史,这就是另一个前沿的学科分支——古病理学。
澎湃科技:这样看来,帕博做的事情真的很伟大。
文少卿:是的。当年人类基因组计划集全球之力,历时约13年,耗资达30亿美元,与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划,是人类科学史上的一个伟大工程。对比现代人基因组草图,帕博团队完成了早期智人——尼安德特人和丹尼索瓦人的基因组草图,其难度可想而知。这些工作都是基础工作, 基础性研究才是创新之源。帕博团队的工作一方面开创了古基因组学研究的新范式,一方面,不同古人类的基因组也为我们理解疾病的根源提供了帮助。例如,基因组中发现了大量具有生理效应的古人类遗传贡献,如免疫系统、脂类代谢系统、高海拔适应;来自尼安德特人的遗传变异也给现代人带来了医学上的影响,如 II 型糖尿病, 幽门螺杆菌易感性以及抑郁症、日光性角化病、血液高凝等疾病。
澎湃科技:基因也有源流。
文少卿:是的,我还关心不同时间阶段,这些基因的频率或者频谱的动态变化,它们怎么从罕见变为常见,或怎么从常见变为罕见的,它们是怎么被固定下来、变成目前现代不同族群基因频谱的样子。比如,现在的一些与疾病高度相关的基因,在几千年前甚至更早的时候,在人群中是常见的吗?我很关心这个。
澎湃科技:是什么造成基因的这种变化?
文少卿:主要是群体历史和环境影响。这需要跨学科探讨这个过程,研究变化的主要驱动力。这个方向太新了。
澎湃科技:再补问一个外行问题,你们怎么确认得到的肢骨是阿史那皇后的?
文少卿:阿史那皇后和武帝宇文邕的身份没有争议,盗墓的人虽然把她和武帝的遗骨搞乱了,但还在原地,陵墓里有证明她身份的墓志、金印等物品。我们也对他俩的遗骨进行了测年,年代就是他们生存的年代,跟历史记载也是一致的。
澎湃科技:通过阿史那皇后和北周武帝宇文邕的研究发现,未来,你们有何打算?
文少卿:会有两个延伸。因为有了阿史那部和宇文邕的数据,我们会继续去测各种历史名人,甚至一些无名无姓的古人样本,帮助我们回答考古和历史上的谜题。
依托社科重大课题《三到九世纪北方民族谱系研究》,我们会梳理匈奴、突厥、鲜卑、吐谷浑、粟特等北方古族的遗传谱系,这些谱系清楚后,我们集中研究秦汉时期的长安城。最终重现大唐盛世海纳百川的盛况,把长安迷人的故事讲清楚。
第二个延伸,是我一直想做的一个计划,我们要做一个全东亚人的遗传谱系树,先把每一个古代人的DNA挂上去,每个人都是树上的一片叶子,这些人会像吸铁石一样,吸引公众参与,建立现代人与古代人的联系,这就是我们中华民族的“大家谱”。用DNA做家谱,这是一件很酷的事情。
澎湃科技:你想让基因说话?
文少卿:对,我们用考古样本或者历史名人去吸引更多像你我一样对历史感兴趣的公众参与进来。有了更多的基因数据之后,又反过来有利于我们再去攻克现代人类疾病。当然,这一切需要有很好的伦理监督。
澎湃科技:感觉你想得很清楚了。
文少卿:我人生的核心目标就是做中华民族的“大家谱”,我做的其他事情属于这个工作的外延。
澎湃科技:能感受到你对科研的热爱,除此以外,你还有什么业余生活吗?
文少卿:看看足球赛,其他就没有了。科研会上瘾。
澎湃科技:科研狂人。
文少卿:狂人谈不上,只是喜欢。