醉面振第48卷第6期2003年3月 古老人群 mtDNA研究中存在的问题和对策 姚永刚①张亚平0② (①中国科学院昆明动物研究所分子进化与基因组多样性实验室,昆明650223;②云南大学云南省科技部共建生物资源保护与利用 重点实验室,昆明650091;③中国科学院研究生院,北京100039.·联系人,Emal:zhangye@publickm.yn.cn) 摘要由于多种原因,古老人类标本中的DNA一般都有不同程度的降解,在分析时只能得到短片段的 序列.如何对这些序列片段的真实性进行甄别,最大限度地挖掘出其中包含的信息,是目前对古代人 群遗传结构分析及其他古DNA研究中普遍存在的一个难题.本文对近期国内古老人群mDNA研究中 存在的问题进行了评述,并从mDNA世系的系统发育关系角度,对新疆(包括邻近的中亚地区)古老人 群数据进行了重新分析.结果显示,这些古老DNA数据的可靠性存在或多或少的问题,结合现代不同 地理人群中的mDNA变异情况,能够对获得的距今数千年前的mDNA的真实性进行判别和自检,并 能有效地对序列信息进行解码_同时,对中亚地区古老人群mDNA数据重新分析的结果,支持该地区 欧亚人群基因交流融合由来已久的推测 关键词古老 DNA mtDNA系统发育问题对策 在缺乏古代人群直接遗传信息的情况下,根据 古老DNA研究的难题之二,是如何对所获得的 现代人群的遗传分析和比较,可为推测人群起源和短的古老DNA序列进行有效地破译,这些DNA序列 迁移提供依据和佐证,这在目前人类学领域较为常通常是位于 mtDNA控制区第1高变区( hypervariable 见12,并且有人倡议建立一个新学科一考古遗传 segmentI of mtDNA control region,HSD的100 学( Archeogenetics)3.由于现代人群遗传结构受群体300bp片段.这一难题的准确解决与否,直接关系到 的迁移历史、基因流和遗传漂变等作用的影响,是否结论的正确性.目前普遍采用的做法是将古老DNA 与历史上人群的遗传结构相似不得而知.同时,现代序列和现代人序列放在一起,构建系统发育树或网 人群中不同遗传标记揭示的遗传图景也可能不同.络关系图,比较其中古老样本和现代样本的聚类情 因此,关于一些特定人群遗传结构和群体历史的争况0这种做法虽然大多基于距离法或简约性原 论颇多.对古代人群遗传结构进行直接研究,有助于则,但由于分析的片段非常短,信息有限,古老样本 解决这些争议,验证一些基于现代人群遗传数据得和现代人样本的聚类关系在由不同参数设置构建的 出的假说因而,古老DNA研究一直受到高度重视.系统树中可能不同1415.而且,将现代人序列剪切成 和古老DNA片段一样的长度,根据距离法构建个体 1古老DNA研究中的难题 或群体间的系统发育树而不考虑世系( lineage)间真 由于在保存过程中受到各种因素的影响,古老实的系统发育关系,往往不能充分地揭示片段中区 标本中的DNA均存在较为严重的降解现象,导致古分 mtDNA单倍型类群( haplogroup)归属的有限信息, 老DNA研究中存在两大难题.难题之一是技术方面,会得出一些非常奇怪的结果一个比较典型的例子 即如何从标本中提取出DNA,扩增出相关的目的片就是wang等人山的工作.他们分析了我国山东淄博 段,并有效地防止外源DNA的污染.针对这一难题,地区距今2500和2000年前1及现代人群mDNA 目前有较多的研究经验和建议,如采用比较特殊的185bp序列数据,认为2500年前的淄博人群和现代 DNA提取方法和技术;多次独立地对同一样品、同欧洲人群比较相似,2000年前的淄博人群则表现为 一标本的不同部位取样进行分析6,在不同实验室现代欧洲和东亚人群的中间类型;过去2500年内我 独立进行实验操作,互相印证7;与来自同一遗址国北方人群母系基因库发生了由欧洲型向东亚型的 中其他标本DNA的成功提取作为对照,或进行其替代.这种“替代”推测一方面和我国人群的迁移历 他形式分析6,看该遗址是否适合古老DNA的保史有较大出入,同时也与该小组近期工作相矛 盾.一方面,他们推测认为过去2500年内,我国北方 www.scichina.com
第 48 卷 第 6 期 2003 年 3 月 论 坛 632 www.scichina.com 古老人群 mtDNA 研究中存在的问题和对策 姚永刚①③ 张亚平①②* (①中国科学院昆明动物研究所分子进化与基因组多样性实验室, 昆明 650223; ②云南大学云南省科技部共建生物资源保护与利用 重点实验室, 昆明 650091; ③中国科学院研究生院, 北京 100039. * 联系人, E-mail: zhangyp@public.km.yn.cn) 摘要 由于多种原因, 古老人类标本中的 DNA 一般都有不同程度的降解, 在分析时只能得到短片段的 序列. 如何对这些序列片段的真实性进行甄别, 最大限度地挖掘出其中包含的信息, 是目前对古代人 群遗传结构分析及其他古 DNA 研究中普遍存在的一个难题. 本文对近期国内古老人群 mtDNA 研究中 存在的问题进行了评述, 并从 mtDNA 世系的系统发育关系角度, 对新疆(包括邻近的中亚地区)古老人 群数据进行了重新分析. 结果显示, 这些古老 DNA 数据的可靠性存在或多或少的问题; 结合现代不同 地理人群中的 mtDNA 变异情况, 能够对获得的距今数千年前的 mtDNA 的真实性进行判别和自检, 并 能有效地对序列信息进行解码. 同时, 对中亚地区古老人群 mtDNA 数据重新分析的结果, 支持该地区 欧亚人群基因交流融合由来已久的推测. 关键词 古老 DNA mtDNA 系统发育 问题 对策 在缺乏古代人群直接遗传信息的情况下, 根据 现代人群的遗传分析和比较, 可为推测人群起源和 迁移提供依据和佐证, 这在目前人类学领域较为常 见[1,2] , 并且有人倡议建立一个新学科 —— 考古遗传 学(Archeogenetics)[3] . 由于现代人群遗传结构受群体 的迁移历史、基因流和遗传漂变等作用的影响, 是否 与历史上人群的遗传结构相似不得而知. 同时, 现代 人群中不同遗传标记揭示的遗传图景也可能不同. 因此, 关于一些特定人群遗传结构和群体历史的争 论颇多. 对古代人群遗传结构进行直接研究, 有助于 解决这些争议, 验证一些基于现代人群遗传数据得 出的假说. 因而, 古老 DNA 研究一直受到高度重视. 1 古老 DNA 研究中的难题 由于在保存过程中受到各种因素的影响, 古老 标本中的 DNA 均存在较为严重的降解现象, 导致古 老 DNA 研究中存在两大难题. 难题之一是技术方面, 即如何从标本中提取出 DNA, 扩增出相关的目的片 段, 并有效地防止外源 DNA 的污染. 针对这一难题, 目前有较多的研究经验和建议, 如采用比较特殊的 DNA 提取方法和技术; 多次独立地对同一样品、同 一标本的不同部位取样进行分析[4~6]; 在不同实验室 独立进行实验操作, 互相印证[6,7]; 与来自同一遗址 中其他标本 DNA 的成功提取作为对照[8] , 或进行其 他形式分析[6,9] , 看该遗址是否适合古老 DNA 的保 存. 古老 DNA 研究的难题之二, 是如何对所获得的 短的古老DNA序列进行有效地破译, 这些DNA序列 通常是位于 mtDNA 控制区第 1 高变区(hypervariable segmentⅠ of mtDNA control region, HVSⅠ)的 100 ~ 300 bp 片段. 这一难题的准确解决与否, 直接关系到 结论的正确性. 目前普遍采用的做法是将古老 DNA 序列和现代人序列放在一起, 构建系统发育树或网 络关系图, 比较其中古老样本和现代样本的聚类情 况[10~13] . 这种做法虽然大多基于距离法或简约性原 则, 但由于分析的片段非常短, 信息有限, 古老样本 和现代人样本的聚类关系在由不同参数设置构建的 系统树中可能不同[14,15] . 而且, 将现代人序列剪切成 和古老 DNA 片段一样的长度, 根据距离法构建个体 或群体间的系统发育树而不考虑世系(lineage)间真 实的系统发育关系, 往往不能充分地揭示片段中区 分 mtDNA 单倍型类群(haplogroup)归属的有限信息, 会得出一些非常奇怪的结果. 一个比较典型的例子 就是 Wang 等人[11]的工作. 他们分析了我国山东淄博 地区距今 2500 和 2000 年前[10]及现代人群 mtDNA 185 bp 序列数据, 认为 2500 年前的淄博人群和现代 欧洲人群比较相似, 2000 年前的淄博人群则表现为 现代欧洲和东亚人群的中间类型; 过去 2500 年内我 国北方人群母系基因库发生了由欧洲型向东亚型的 替代. 这种“替代”推测一方面和我国人群的迁移历 史[16]有较大出入, 同时也与该小组近期工作[17]相矛 盾. 一方面, 他们推测认为过去 2500 年内, 我国北方
论坛 第48卷第6期2003年3月斜荸通扳 人群的母系基因库发生了由欧洲型向东亚型的替相近匹配( matching or near- matching)分析,可以将它 代,另一方面,他们又认为东亚不同地理人群母们划归到系统发育树的各个聚类枝中.然后,通过比 系遗传结构存在较大的同源性,并且将这种同源性较不同群体中各单倍型类群的分布情况和序列变异, 归于新石器时期农业人口的扩张.显然,新石器可以很好地显示出群体的地理分化、遗传结构的时空 时期农业的扩张在时间上要早于2500多年前的史载变化,以及估算出群体扩张或发生迁移的大致时间 时期.如果新石器时期人类的活动就界定了后期人这种可称之为系统发育地理分析( phylogeographic 群的遗传结构,那么又怎会有后期母系基因库替代 analysis)的方法,在近期的工作中有较多的使用和报 发生?最近,我们对这批数据进行了重新分析.结果道8192,2),并且对于诠释古老DNA也非常有 提示,山东古代群体mDNA类型,基本上都可以归效1820.下面就以最近崔银秋等人1发表的数据作 属到报道的东亚人群 mtdNA类型中819,遗传结构为例子,具体阐明如何从 mtdNA的系统发育关系来 总体上和我国南方人群相似性较大.因此,在对判别和解释古老DNA数据 得到的短的序列片段进行分析和解释时,一定要相 崔等人分析了距今2000~2500年前新疆吐鲁 当谨慎20 番交河故城一号台地4个个体 mtDNA HVSI序列363 既然短片段含有的信息量有限,一个自然的想bp的变异情况(其实是标准序列23中16056~16378 法就是尽量获取长的序列片段来进行分析.由于古区域间的323bp片段,应当去除两端引物序列),同 老样本中现实情况是DNA大多被降解,每次扩增只时还检测了单倍型类群A(+663HaeI,B(COⅡ和 能获得短的片段,通过多个短片段的重叠扩增和测tRNA基因间9bp片段的缺失( bp del), 序,理论上可以拼接出一个长一点的片段.而且,我C(-13259Hinc),D(-51764l)和M+10394 Dde I 们还可以借鉴目前现代人群 mtDNA的研究结果,针+10397lI)的特征变异位点.这样对同一个样本同 对不同 mtDNA类群的一些编码区特征变异位点设计时进行控制区和编码区序列分析,理论上比仅仅依 引物,得到含有该位点的短片段,进而分析获得更多据一段短的HVSI序列信息进行 mtDNA单倍型类群 的信息。但在实际操作过程中,这种多次扩增及对多的划分更准确、可靠,值得提倡.这其中,类群C和 个不同区域片段进行分析,往往也会增加污染或其D是M的子类群或亚类群( sub-haplogroup).也就是 他出错的机会,不能保证每次得到的片段都是古老说,在 mtDNA系统树中,C和D聚类枝是包含在 样本的真实DNA,这无疑也为古老DNA研究增添了个较大的称为M的大聚类枝中,M类群的4个特征界 判别真伪的难度,目前,还没有方法能彻底解决这一定位点,489~10400~14783~15043(相对于作为外 难题.从mDNA世系的系统发育关系角度,对得到群( outgroup)的非洲L3类群,在类群C和D的个 的古DNA序列信息进行综合考虑和分析,能够为判体中都会出现类群C和D的区别则体现在各自的 别这些片段的真伪提供线索,从而对一些值得怀疑单倍型类群的特异性突变上,如D类群含有 的序列在发表前重新分析证实,避免将不准确的数5178A(变异位点加上突变后的碱基以突出该点是颠 据公布于众 换;-5176I)和4883等突变,而类群C含有3552A 2从 mtDNA的系统发育关系角度解码古951914.13263139mc01)和14318等突 变181类群A在系统发育关系上属于一个大的类 老DNA 群N,类群B在系统发育关系上属于类群R(类群R mtDNA所特有的遗传特性,如母系遗传、缺乏本身又是类群N的一个子类群).而且,大多数单倍 重组等,决定了mDNA序列上发生的每一次突变事型类群在控制区序列中也有特征变异模式(motf 件(回复突变和突变热点除外)都能在序列中记录下如类群A含有16223~16290~16319的变异模式,D 来通过对序列上累积的这些突变进行分析,理论上含有16223~16362,C含有16223~16298~16327, 可以重建mDNA真实的系统树.对于每一个mDNA,B含有16189.这些类群的巢式( nested)归属系统关系, 根据其是否含有系统发育树中某个聚类枝(亦即单倍反映在崔等人检测的酶切位点和HVSI变异组 型类群)的特征界定突变,也就是相对较古老一些的合中,只会出现以下结果:类群A,+66Hae 突变,同时和数据库中经过编码区信息准确证实的+5176All,9 bp non-del,-10394 Dde I,-103974lI 单倍型类群归属的其他 mtDNA世系进行序列匹配或 www.scichina.com
论 坛 第 48 卷 第 6 期 2003 年 3 月 www.scichina.com 633 人群的母系基因库发生了由欧洲型向东亚型的替 代[11]; 另一方面, 他们又认为东亚不同地理人群母 系遗传结构存在较大的同源性, 并且将这种同源性 归于新石器时期农业人口的扩张[17] . 显然, 新石器 时期农业的扩张在时间上要早于 2500 多年前的史载 时期. 如果新石器时期人类的活动就界定了后期人 群的遗传结构, 那么又怎会有后期母系基因库替代 发生?最近, 我们对这批数据进行了重新分析. 结果 提示, 山东古代群体 mtDNA 类型, 基本上都可以归 属到报道的东亚人群 mtDNA 类型中[18,19] , 遗传结构 总体上和我国南方人群相似性较大[20] . 因此, 在对 得到的短的序列片段进行分析和解释时, 一定要相 当谨慎[20] . 既然短片段含有的信息量有限, 一个自然的想 法就是尽量获取长的序列片段来进行分析. 由于古 老样本中现实情况是 DNA 大多被降解, 每次扩增只 能获得短的片段, 通过多个短片段的重叠扩增和测 序, 理论上可以拼接出一个长一点的片段. 而且, 我 们还可以借鉴目前现代人群 mtDNA 的研究结果, 针 对不同 mtDNA类群的一些编码区特征变异位点设计 引物, 得到含有该位点的短片段, 进而分析获得更多 的信息. 但在实际操作过程中, 这种多次扩增及对多 个不同区域片段进行分析, 往往也会增加污染或其 他出错的机会, 不能保证每次得到的片段都是古老 样本的真实 DNA, 这无疑也为古老 DNA 研究增添了 判别真伪的难度. 目前, 还没有方法能彻底解决这一 难题. 从 mtDNA 世系的系统发育关系角度, 对得到 的古 DNA 序列信息进行综合考虑和分析, 能够为判 别这些片段的真伪提供线索, 从而对一些值得怀疑 的序列在发表前重新分析证实, 避免将不准确的数 据公布于众. 2 从 mtDNA 的系统发育关系角度解码古 老 DNA mtDNA 所特有的遗传特性, 如母系遗传、缺乏 重组等, 决定了 mtDNA 序列上发生的每一次突变事 件(回复突变和突变热点除外)都能在序列中记录下 来. 通过对序列上累积的这些突变进行分析, 理论上 可以重建 mtDNA真实的系统树. 对于每一个mtDNA, 根据其是否含有系统发育树中某个聚类枝(亦即单倍 型类群)的特征界定突变, 也就是相对较古老一些的 突变, 同时和数据库中经过编码区信息准确证实的 单倍型类群归属的其他 mtDNA 世系进行序列匹配或 相近匹配(matching or near-matching)分析, 可以将它 们划归到系统发育树的各个聚类枝中. 然后, 通过比 较不同群体中各单倍型类群的分布情况和序列变异, 可以很好地显示出群体的地理分化、遗传结构的时空 变化, 以及估算出群体扩张或发生迁移的大致时间. 这种可称之为系统发育地理分析(phylogeographic analysis)的方法, 在近期的工作中有较多的使用和报 道[18,19,21,22] , 并且对于诠释古老 DNA 也非常有 效[18,20] . 下面就以最近崔银秋等人[13]发表的数据作 为例子, 具体阐明如何从 mtDNA 的系统发育关系来 判别和解释古老 DNA 数据. 崔等人[13]分析了距今 2000 ~ 2500 年前新疆吐鲁 番交河故城一号台地 4 个个体 mtDNA HVSI 序列 363 bp 的变异情况(其实是标准序列[23]中 16056 ~ 16378 区域间的 323 bp 片段, 应当去除两端引物序列), 同 时还检测了单倍型类群 A( + 663HaeⅢ), B(COⅡ和 tRNALys 基因间 9 bp 片段的缺失 (9 bp del)), C(-13259HincⅡ), D(-5176AluⅠ)和 M(+10394DdeⅠ, +10397AluⅠ)的特征变异位点. 这样对同一个样本同 时进行控制区和编码区序列分析, 理论上比仅仅依 据一段短的 HVSⅠ序列信息进行 mtDNA单倍型类群 的划分更准确、可靠, 值得提倡. 这其中, 类群 C 和 D 是 M 的子类群或亚类群(sub-haplogroup). 也就是 说, 在 mtDNA 系统树中, C 和 D 聚类枝是包含在一 个较大的称为 M 的大聚类枝中, M 类群的 4 个特征界 定位点, 489 ~ 10400 ~ 14783 ~ 15043(相对于作为外 群(outgroup)的非洲 L3 类群[19]), 在类群 C 和 D 的个 体中都会出现. 类群 C 和 D 的区别则体现在各自的 单倍型类群的特异性突变上, 如 D 类群含有 5178A(变异位点加上突变后的碱基以突出该点是颠 换; -5176AluⅠ)和4883等突变, 而类群C含有3552A, 9545, 11914, 13263(-13259HincⅡ)和 14318 等 突 变[18,19] . 类群 A 在系统发育关系上属于一个大的类 群 N, 类群 B 在系统发育关系上属于类群 R(类群 R 本身又是类群 N 的一个子类群). 而且, 大多数单倍 型类群在控制区序列中也有特征变异模式(motif), 如类群 A 含有 16223 ~ 16290 ~ 16319 的变异模式, D 含有 16223 ~ 16362, C含有 16223 ~ 16298 ~ 16327, B含有16189. 这些类群的巢式(nested)归属系统关系, 反映在崔等人[13]检测的酶切位点和 HVSⅠ变异组 合 中, 只会出现以下结果: 类 群 A, + 663HaeⅢ, + 5176AluⅠ, 9 bp non-del, -10394DdeⅠ, -10397AluⅠ
醉面振第48卷第6期2003年3月 +13259 Hinc I,16223~16290~16319,类群B,-663体是N类群个体编码区和C类群个体控制区序列间 HaeⅢ,+5176AlI,9 bp del,-/H+10394DdeI,的人为重组.样本1的HⅤsI序列为16298~16319, 10397AlnI,+13259HincⅡl,16189,类群C,-663在我们收集的我国人群mDNA数据库(超过2200人) Hael,+5176AwI,9 bp non-del,+10394DdeI,中没有发现完全匹配类型,但和新疆地区维吾尔 +103974/I,-13259HincⅡ,16223~16298~16327;族、回族以及武汉汉族样本8中变异为1623 类群D,-663HaeⅢ,-5176AhI,9 bp nodel,16298~16319,属于单倍型类群M8a个体的序列相 10394DdeI,-10397lI,+13259HincⅡ,16189~近.如果样本1也属于M8a类群,那么就一定存在 6223~16362(10397位置上的突变会导致10394DdeI5176AlI酶切位点,而不是文献[3表2中观察到的 和10397AluI酶切位点同时消失,该变异界定了D仅D类群中才出现的-51764lI.所以,该序列可能 类群的一个子类群D5819)或-63Hael,-51764hI,是类群M8a和D的一个重组,并且16223位置上的 9 bp nodel,+l0394DdeI,+103974lwI,+13259突变被漏读.这种不同 mtDNA单倍型类群间序列人 Hinc ll,16223~16362.如果出现其他的一些酶切组为重组的现象,在近期报道的数据中并不少见,譬如 合类型(不包括COⅡ和RNA基因间9bp片段的缺Le等人报道的98个韩国人 mtdNA控制区和细胞 失,该缺失在其他单倍型类群中可能会多次独立发色素B基因全序列中,就存在较多的不同单倍型类群 生,最大可能就是由于污染,或者是实验过程中间的序列重组和碱基漏读现象;SiⅤa等人2测定的 人为因素导致不同样本混淆造成不同 mtDNA世系间88 kb mtDNA序列中也存在人为的序列重组现象 的人工重组 并且还漏读了相当多的变异位点.采用本文介绍的 在崔等人13文章的表2中,来自不同墓地的样从mDNA系统发育关系角度对序列进行自检,也许 本2和4的HVSI序列仅含有16234变异(表2提到可以发现数据中存在的问题,从而在发表之前重新 16234发生CT转换是正确的,但在第4页却将其核实 误写为TC转换和AC颠换),酶切结果相同3中亚地区古老DNA的重新分析 (663 Haelll, +5176Alu 1, 9 bp nodel, -10394Dde I 根据上文提到的序列匹配和相近匹配分析,还 -1039741,+1329n),显示该类型属于N类可以对报道的中亚地区其他古老人群mDNA3试 群或R类群(包括N和R的子类群)由于该个体的序着进行单倍型类群的划分,并根据这些古老mDNA 列在 Richards等人2统计的欧洲人群中出现在两个在现今人群中是否有分布和分布的情况来推测更多 H类型个体中,并且还存在3个相差一次突变的相近的历史 Clisson等人B研究了距今2000多年前同一 类型(H:16234~16293,16234~16349del;]:16126 个墓穴发掘出的两个样本.其中,样本1的HVSI序 16234),所以该 mtDNA类型很可能属于欧洲型单倍列对应于标准序列16021-16417区域)和标准序列 型类群H.样本3的HVSI序列变异为16129 完全相同,很可能是欧洲人群中高频率分布的H类 1623-16298-16327,具有类群C的变异模式,并型,而且该H类型在中亚人群和我国新疆地区人 且与报道的新疆汉族1个C类型个体X8435和维群2也有分布值得注意的是,我国广东汉族9和 吾尔族1个C类型个体的序列完全匹配此外在云南傣族13样本中也有HSI序列和标准序列完 我国西安汉族人群、中亚人、蒙古人(只有编号全相同的个体,但编码区序列分析表明,这些个体属 1722的个体,而非表3中提到的2个个体)、西伯于东亚人群特有的类群H2或M7样本2序列变异为 利亚 Koryak人群和Mans人群以及泰国Akah16223-16278-16362,具有典型的G类群HⅤSI变 人群中也有与该样本序列完全匹配的C类型个体.异模式,和我们测定的新疆地区蒙古族样本中G类 然而,对该样本编码区的分析结果(-663HaeⅢ,型(+4831H/ha1)个体序列完全一致此外,和样本 +517641,9 bp non-del,-10394Ddel,-10397m1,2序列相差一次碱基突变的G类型,如16223~16227 +13259 Hinc II)表明,该个体属于N类群(包括其子 16278~16362,16223~16234~16278~16362和 类群),不属于类群M,更不属于类群C.因此,该个 1)姚永刚.中华民族源流探讨-线粒体DNA的研究.中国科学院研究生院博士学位论文2002 www.scichina.com
第 48 卷 第 6 期 2003 年 3 月 论 坛 634 www.scichina.com +13259HincⅡ, 16223 ~ 16290 ~ 16319; 类群 B, -663 HaeⅢ, + 5176AluⅠ , 9 bp del, -/+10394DdeⅠ , -10397 AluⅠ, + 13259HincⅡ, 16189; 类群 C, -663 HaeⅢ, +5176 AluⅠ, 9 bp non-del, +10394DdeⅠ, +10397AluⅠ, -13259HincⅡ, 16223 ~ 16298 ~ 16327; 类 群 D, -663HaeⅢ , -5176Alu Ⅰ , 9 bp non-del, -10394DdeⅠ, -10397AluⅠ, +13259HincⅡ, 16189 ~ 16223 ~ 16362 (10397 位置上的突变会导致 10394DdeⅠ 和 10397AluⅠ酶切位点同时消失, 该变异界定了 D 类群的一个子类群 D5[18,19])或-663HaeⅢ, -5176AluⅠ, 9 bp non-del, +10394DdeⅠ, +10397AluⅠ, +13259 HincⅡ, 16223 ~ 16362. 如果出现其他的一些酶切组 合类型(不包括COⅡ和 tRNALys 基因间9 bp 片段的缺 失, 该缺失在其他单倍型类群中可能会多次独立发 生[24]), 最大可能就是由于污染, 或者是实验过程中 人为因素导致不同样本混淆造成不同 mtDNA世系间 的人工重组. 在崔等人[13]文章的表 2 中, 来自不同墓地的样 本 2 和 4 的 HVSⅠ序列仅含有 16234 变异(表 2 提到 16234 发生 C T 转换是正确的, 但在第 4 页却将其 误写为 T C 转换和 A C 颠换), 酶切结果相同 (-663HaeⅢ, +5176AluⅠ, 9 bp non-del, -10394DdeⅠ, -10397AluⅠ, +13259HincⅡ), 显示该类型属于 N 类 群或 R 类群(包括 N 和 R 的子类群). 由于该个体的序 列在 Richards 等人[22]统计的欧洲人群中出现在两个 H 类型个体中, 并且还存在 3 个相差一次突变的相近 类型(H: 16234 ~ 16293, 16234 ~ 16349 del; J: 16126 ~ 16234), 所以该 mtDNA 类型很可能属于欧洲型单倍 型类群 H. 样本 3 的 HVSⅠ序列变异为 16129 ~ 16223 ~ 16298 ~ 16327, 具有类群 C 的变异模式, 并 且与报道的新疆汉族1 个C 类型个体(XJ8435)[18]和维 吾尔族 1 个 C 类型个体[25]的序列完全匹配. 此外, 在 我国西安汉族人群[17]、中亚人[26]、蒙古人(只有编号 17.22 的个体, 而非表 3 中提到的 2 个个体) [27]、西伯 利亚 Koryak 人群[28]和 Mansi 人群[29]以及泰国 Akah 人群[30]中也有与该样本序列完全匹配的 C 类型个体. 然 而, 对该样本编码区的分析结果(-663HaeⅢ, + 5176AluⅠ, 9 bp non-del, -10394DdeⅠ, -10397AluⅠ, + 13259HincⅡ)表明, 该个体属于 N 类群(包括其子 类群), 不属于类群 M, 更不属于类群 C. 因此, 该个 体是 N 类群个体编码区和 C 类群个体控制区序列间 的人为重组. 样本 1 的 HVSⅠ序列为 16298 ~ 16319, 在我们收集的我国人群 mtDNA数据库(超过 2200 人) 中没有发现完全匹配类型, 但和新疆地区维吾尔 族[25]、回族 1)以及武汉汉族样本[18]中变异为 16223 ~ 16298 ~ 16319, 属于单倍型类群 M8a 个体的序列相 近. 如果样本 1 也属于 M8a 类群, 那么就一定存在 5176AluⅠ酶切位点, 而不是文献[13]表2 中观察到的 仅 D 类群中才出现的-5176AluⅠ. 所以, 该序列可能 是类群 M8a 和 D 的一个重组, 并且 16223 位置上的 突变被漏读. 这种不同 mtDNA 单倍型类群间序列人 为重组的现象, 在近期报道的数据中并不少见, 譬如 Lee 等人[31]报道的98 个韩国人 mtDNA控制区和细胞 色素B基因全序列中, 就存在较多的不同单倍型类群 间的序列重组和碱基漏读现象; Silva 等人[32]测定的 8.8 kb mtDNA 序列中也存在人为的序列重组现象, 并且还漏读了相当多的变异位点. 采用本文介绍的 从 mtDNA 系统发育关系角度对序列进行自检, 也许 可以发现数据中存在的问题, 从而在发表之前重新 核实. 3 中亚地区古老 DNA 的重新分析 根据上文提到的序列匹配和相近匹配分析, 还 可以对报道的中亚地区其他古老人群 mtDNA[33, 34]试 着进行单倍型类群的划分, 并根据这些古老 mtDNA 在现今人群中是否有分布和分布的情况来推测更多 的历史. Clisson 等人[33]研究了距今 2000 多年前同一 个墓穴发掘出的两个样本. 其中, 样本 1 的 HVSⅠ序 列(对应于标准序列 16021 ~ 16417 区域)和标准序列 完全相同, 很可能是欧洲人群中高频率分布的 H 类 型, 而且该 H 类型在中亚人群[26]和我国新疆地区人 群[25]也有分布. 值得注意的是, 我国广东汉族[19]和 云南傣族[21,35]样本中也有 HVSⅠ序列和标准序列完 全相同的个体, 但编码区序列分析表明, 这些个体属 于东亚人群特有的类群 F2 或 M7. 样本 2 序列变异为 16223 ~ 16278 ~ 16362, 具有典型的 G 类群 HVSⅠ变 异模式, 和我们测定的新疆地区蒙古族样本中 G 类 型(+4831HhaⅠ)个体序列1)完全一致. 此外, 和样本 2 序列相差一次碱基突变的 G 类型, 如16223 ~ 16227 ~ 16278 ~ 16362, 16223 ~ 16234 ~16278 ~ 16362 和 1) 姚永刚. 中华民族源流探讨-线粒体 DNA 的研究. 中国科学院研究生院博士学位论文. 2002
论坛 第48卷第6期2003年3月斜荸通扳 16093~16223~16278~16362等,在中亚人、我多年前mDNA的重新分析显示,这些古老DNA数 国新疆的回族、蒙古族和维吾尔族中也有分布 据的可靠性存在或多或少的问题.将报道的这些古 Ovchinnikov等人分析了了距今约2000年前老样本凑在一起(共9个),可以从“群体”这一角度来 Jety-Asar人群的3个标本,这些标本的头骨都表现出窥视2000多年前中亚地区人群的母系基因库组成 欧洲人的特征.他们测定的HVSI序列对应于标准显然,2000多年前中亚地区人群的 mtDNA类型都可 序列16208~16401区域,酶切分析相对于崔等人多以归属到现代欧亚人群特异性的单倍型类群 检测了16517Hae位点样本1的变异为663HaeI,中8192),和现今该地区人群在母系遗传组分上类 +5176Ah1,9 bp non-del,-10394DdeI,-103974I,似326,而且,大多数古老mDNA类型在当地现代 +13259HincⅡ,+16517HaelⅢl,16362.该个体和新疆人群中都能够找到序列完全一致的匹配个体,这支 维吾尔族中1个H类型个体的HVSI序列(16362~持中亚地区欧亚人群基因交流和融合由来已久的推 16482)相同2,在新疆汉族的3个D类型 mtDNA中测 (16362;16174-16362,16093-16362)18中也出现.进 短的HVSI序列提供的信息毕竟有限.一些个 步和 Richards等人2)汇总的欧洲人群数据库比较体的HⅤSI序列相同,但也可能属于不同单倍型类 后发现,该样本的序列在欧洲人群中的H类型群,如上文中提到HVSI序列和标准序列相同的个 (16095G.1618816362.16111-16362,16129体可以是欧洲型的H类型,也可以是东亚型的M7或 16362,16189~16362,16192~16362,16362,16362F2等类型.分析的片段越短,序列出现相同的机会 16482),HV类型(16168~16362,16192A~16362,就越多.这在客观上也为我们依据序列匹配和相近 16362),J类型(l6126~16362,16126~16193~16362)匹配分析带来难度和不确定性.所以,对于古老样本 和U类型(16362,16189~16362,16153~16362,在获取控制区序列后,先依据得到的信息进行单倍 16129~16362,16129~16189~16362,16129C~型类群归属的预测,进而对相关编码区类群特征性 16189~16362)等也出现显然,这里序列匹配分析位点进行检测和验证是完全必要的如果编码区 不能准确提示样本1到底属于哪个类群样本2变异提供的信息和控制区变异模式有矛盾,这就提示该 为-66H+51764m1,9 bp non - del10394Dde,样本的DNA很可能有污染,需要重新提取DNA进行 10397A1m1,+13259HmcⅡ,-16517 haelll,16223~分析.对于因材料受限制而不能够再次分析的样本 16257A-16261,属于典型的N9a类群该序列在我对数据的矛盾之处在结果中作一个说明不失为明智 国人群中分布频率为0%~8%,且在南方和西北地区的做法本文倡导的这种对数据进行自检的思路,对 人群中频率较高一些182123另外,在中亚人2、于动物古老DNA分析同样也有借鉴意义我们建议 伊朗人凹2、蒙古人四、韩国人和日本人等都有在不能够完全排除实验方面存在缺陷可能带来的污 分布,而在欧洲人群中没有发现.所以,该样本染时,一定要对得到的mDNA数据从世系的系统发 mDNA属于亚洲人群特有类型.样本3编码区信息育关系角度进行自检,解释也要谨慎,这样才能够最 (-6635e1-51761,9 bp non-del,-10394DdeI,大限度地避免错误的结论 103974I,+13259HicⅡl,+16517Hael)显示该致谢本工作为国家自然科学基金(批准号:30024004)、云 个体属于D5类群,也就是说,该个体HⅤSI序列理南省自然科学基金(批准号:200007M)和中国科学院重 论上会有16189~1623~163062的特征变异模式,要方向(批准号:KSCX2SW2010)资助项目 但 Ovchinnikov等人观察到的HⅤSI变异为16223 参考文献 ~16311~16357,与云南汉族(YN164)和辽宁汉族 (LN7593)中的M10类型序列18完全匹配,而在我们 1姚永刚,张亚平.线粒体DNA和人类进化.动物学研究,2000 数据库的D5类型中找不到任何匹配或相近的匹配类 21:392-406 型.所以,一个可能的解释是该个体存在D5和M10 archaeological perspectives on human diversity in Southeast Asia. 类型序列间的人为重组 Singapore: World Scientific Publishing Co Pte Ltd, 2001. 41-171 3 Renfrew C. From molecular genetics to archaeogenetics 4小结 Acad Sci USA,2001,98:4830~4832 4 Krings M. Stone A C. Schmitz R W. et al. Neandertal DNA 对来自中亚地区(包括我国新疆地区)距今2000 sequences and the origin of modern humans. Cell, 1997, 90 www.scichina.com
论 坛 第 48 卷 第 6 期 2003 年 3 月 www.scichina.com 635 16093 ~ 16223 ~ 16278 ~ 16362 等, 在中亚人[26]、我 国新疆的回族、蒙古族和维吾尔族[25]中也有分布. Ovchinnikov 等人[34]分析了了距今约 2000 年前 Jety-Asar 人群的 3 个标本, 这些标本的头骨都表现出 欧洲人的特征. 他们测定的 HVSⅠ序列对应于标准 序列 16208 ~ 16401 区域, 酶切分析相对于崔等人[13]多 检测了 16517HaeⅢ位点. 样本 1 的变异为-663HaeⅢ, + 5176AluⅠ, 9 bp non-del, -10394DdeⅠ, -10397AluⅠ, +13259HincⅡ, +16517HaeⅢ, 16362. 该个体和新疆 维吾尔族中 1 个 H 类型个体的 HVSⅠ序列(16362 ~ 16482)相同[25] , 在新疆汉族的 3 个 D 类型 mtDNA 中 (16362; 16174~16362; 16093~16362)[18]中也出现. 进 一步和 Richards 等人[22]汇总的欧洲人群数据库比较 后发现, 该样本的序列在欧洲人群中的 H 类 型 (16095G ~ 16188 ~ 16362, 16111 ~ 16362, 16129 ~ 16362, 16129 ~ 16153 ~ 16362, 16150 ~ 16362, 16173 ~ 16362, 16189 ~ 16362, 16192 ~ 16362, 16362, 16362 ~ 16482), HV 类型(16168 ~ 16362, 16192A ~ 16362, 16362), J 类型(16126 ~ 16362, 16126 ~ 16193 ~ 16362) 和 U 类型(16362, 16189 ~ 16362, 16153 ~ 16362, 16129 ~ 16362, 16129 ~ 16189 ~ 16362, 16129C ~ 16154 ~ 16362, 16129C ~ 16189 ~ 16362, 16129T ~ 16189 ~ 16362)等也出现. 显然, 这里序列匹配分析 不能准确提示样本 1 到底属于哪个类群. 样本 2 变异 为-663HaeⅢ, + 5176AluⅠ, 9 bp non-del, -10394DdeⅠ, -10397AluⅠ, +13259HincⅡ, -16517HaeⅢ, 16223 ~ 16257A ~ 16261, 属于典型的 N9a 类群. 该序列在我 国人群中分布频率为0% ~ 8%, 且在南方和西北地区 人群中频率较高一些[18,21,25,35] . 另外, 在中亚人[26]、 伊朗人[22]、蒙古人[27]、韩国人[31]和日本人[36]等都有 分 布, 而在欧洲人群中没有发现. 所 以, 该样本 mtDNA 属于亚洲人群特有类型. 样本 3 编码区信息 (-663HaeⅢ, -5176AluⅠ, 9 bp non-del, -10394DdeⅠ, -10397AluⅠ, +13259HincⅡ, +16517 HaeⅢ)显示该 个体属于 D5 类群, 也就是说, 该个体 HVSⅠ序列理 论上会有 16189 ~ 16223 ~ 16362 的特征变异模式, 但 Ovchinnikov等人[34]观察到的 HVSⅠ变异为 16223 ~ 16311 ~ 16357, 与云南汉族(YN164)和辽宁汉族 (LN7593)中的 M10 类型序列[18]完全匹配, 而在我们 数据库的 D5 类型中找不到任何匹配或相近的匹配类 型. 所以, 一个可能的解释是该个体存在 D5 和 M10 类型序列间的人为重组. 4 小结 对来自中亚地区(包括我国新疆地区)距今 2000 多年前 mtDNA 的重新分析显示, 这些古老 DNA 数 据的可靠性存在或多或少的问题. 将报道的这些古 老样本凑在一起(共 9 个), 可以从“群体”这一角度来 窥视 2000 多年前中亚地区人群的母系基因库组成. 显然, 2000 多年前中亚地区人群的 mtDNA 类型都可 以归属到现代欧亚人群特异性的单倍型类群 中[18,19,22] , 和现今该地区人群在母系遗传组分上类 似[25~26] , 而且, 大多数古老 mtDNA 类型在当地现代 人群中都能够找到序列完全一致的匹配个体, 这支 持中亚地区欧亚人群基因交流和融合由来已久的推 测. 短的 HVSⅠ序列提供的信息毕竟有限. 一些个 体的 HVSⅠ序列相同, 但也可能属于不同单倍型类 群, 如上文中提到 HVSⅠ序列和标准序列相同的个 体可以是欧洲型的 H 类型, 也可以是东亚型的 M7 或 F2 等类型. 分析的片段越短, 序列出现相同的机会 就越多. 这在客观上也为我们依据序列匹配和相近 匹配分析带来难度和不确定性. 所以, 对于古老样本, 在获取控制区序列后, 先依据得到的信息进行单倍 型类群归属的预测, 进而对相关编码区类群特征性 位点进行检测和验证是完全必要的[20] . 如果编码区 提供的信息和控制区变异模式有矛盾, 这就提示该 样本的DNA很可能有污染, 需要重新提取DNA进行 分析. 对于因材料受限制而不能够再次分析的样本, 对数据的矛盾之处在结果中作一个说明不失为明智 的做法. 本文倡导的这种对数据进行自检的思路, 对 于动物古老 DNA 分析同样也有借鉴意义. 我们建议, 在不能够完全排除实验方面存在缺陷可能带来的污 染时, 一定要对得到的 mtDNA 数据从世系的系统发 育关系角度进行自检, 解释也要谨慎, 这样才能够最 大限度地避免错误的结论. 致谢 本工作为国家自然科学基金(批准号: 30024004)、云 南省自然科学基金(批准号: 2000C0077M)和中国科学院重 要方向(批准号: KSCX2-SW-2010)资助项目. 参 考 文 献 1 姚永刚, 张亚平. 线粒体 DNA 和人类进化. 动物学研究, 2000, 21: 392~406 2 Jin L, Seielstad M, Xiao C, et al. Genetic, linguistic and archaeological perspectives on human diversity in Southeast Asia. Singapore: World Scientific Publishing Co Pte Ltd, 2001. 41~171 3 Renfrew C. From molecular genetics to archaeogenetics. Proc Natl Acad Sci USA, 2001, 98: 4830~4832 4 Krings M, Stone A C, Schmitz R W, et al. Neandertal DNA sequences and the origin of modern humans. Cell, 1997, 90:
醉面振第48卷第6期2003年3月 云 19-30 5 Stone A C, Stoneking M. mtDNA analysis of prehistoric Oneota China- evidence from mtDNA and melanocortin 1 receptor population: implications for the peopling of the new world. Am J olymorphism Genes Genet Syst, 2000, 75: 173-178 Hum Genet,1998,62:1153-1170 6 Comas D, Calafell F, Mateu E, et al. Trading genes along the Silk Hofreiter M, Serre D, Poinar H N, et al. Ancient DNA. Nat Rev Road: mtDNA sequences and the of Central Asian Genet,2001,2:353-359 populations. Am J Hum Genet, 1998, 63: 1824-1838 7 Handt O, Krings M, Ward R H, et al. The retrieval of ancier Kolman C. Sambuughin N. Bermingham E Mitochondrial DNA human DNA sequences. Am J Hum Genet, 1996, 59: 368~376 analysis of Mongolian populations and implications for the origin of new world founders. Genetics. 1996.142: 1321-1334 8 Cooper A Reply to Stoneking: ancient DNA- how do you 28 Schurr T G. Sukemikrl Starikoyskava y b et al. mitochondrial ally know when you have it? Am J Hum Genet, 1997, 60 DNA variation in Koryaks and Itel'men: population replacement 1001~1002 the Okhotsk Sea-Bering Sea region during the Neolithic. Am j 9 Smith C 1, Chamberlain A T, Riley M S, et al. Neanderthal DNA. Phys Anthropol, 1999, 108: 1-39 9 DerbenevaO A, Starikovskaya E B, Wallace D C, et al. Traces of 10 Oota H, Saitou N, Matsushita T, et al. Molecular genetic analysis early Eurasians in the Mansi of northwest Siberia revealed by of remains of a 2000-year-old human population in China-and its mitochondrial DNA analysis. Am J Hum Genet, 2002, 70 relevance for the origin of the modern Japanese population. Am J 009-1014 Hum Genet,1999,64:250-258 30 Oota H, Settheetham-lshida W, Tiwawech D, et al. Human 11 Wang L, Oota H, Saitou N, et al. mtdNA and Y-chromosome variation is correlated with matrilocal 2, 500-year-old human population in Ch its spatiotemporal ersus patrilocal residence. Nat Genet, 2001, 29: 20-21 ee SD, Lee Y S, Lee J B. Polymorphism in the mitochondrial 12 Adcock G J. Dennis E S. Easteal S. et al. Mitochondrial DNA ytochrome B gene in Koreans: an additional marker for equences in ancient Australians: implications for modern human individual identification. Int J Legal Med, 2002, 116: 74-75 origins. Proc Natl Acad Sci USA, 2001, 98: 537-542 32 Silva Jr w A. Bonatto s l. Holanda a j. et al. Mitochondrial 崔银秋,段然慧,季朝能, 故城古车师人的线粒体 genome diversity of Native Americans supports a single early entry of founder populations into America. Am J Hum Genet, DNA分析.高等学校化学学报,2002,23:1 2002,71:187~192 14 Cooper A, Rambaut A, Macaulay V, et al. Human origins and 33 Clisson I Keyser C, Francfort H P, et al analysis of ancient human dNA. scie 001,292:1655-1656 human remains from a double inhumation in 15 Gutierrez G, Sanchez D, Marin A. A reanalysis of the ancient Kazakhstan(Berel site, Early 3rd Century BC J Legal Med, mitochondrial DNA sequences recovered from Neandertal bones 2002,116:304~308 Mol Biol evol,2002,19:1359~1366 34 Ovchinnikov 1, Buzhilova A, Mednikova M, et al. Ethnic affinities 6葛剑雄,曹树基,吴松弟.中国移民史。福州:福建人民出版社, of the ancient human Jety-Asar population by mitochondrial DNA analysis Electrophoresis, 1999, 20: 1729-1732 35 Yao Y G, Nie L, Harpending H, et al. Genetic relationship of 17 Oota H, Kitano T, Jin F, et al. Extreme mtDNA homogeneity of continental Asian populations. Am J Phys Anthropol, 2002, 118 Chinese ethnic populations revealed by mtDNA sequence diversity 146~153 Am J Phys Anthropol, 2002, 1 18: 63-76 18 Yao Y G, Kong Q P, Bandelt H J, et al. Phylogeographic Imaizumi k. parsons t. yoshino m. et al a new database of differentiation of mitochondrial DNA in Han Chinese. Am J Hur mitochondrial DNA hypervariable regions I and II sequences Genet,2002,70:635-651 from 162 Japanese individuals. Int J Legal Med, 2002, 116: 68-73 19 Kivisild T. Tolk H. Parik J et al. The limbs and twigs of the east Asian mtDNA tree. Mol Biol Evol. 2002. 19: 1737-1751 (2002-11-14收稿,2003-01-16收修改稿) 20 Yao Y G, Kong Q P, Man X Y, et al. Reconstructing the evolutionary history of China: a caveat about inferences drawn from ancient DNA. Mol Biol Evol, 2003, 20(2): 214-219 21 Yao Y G, Zhang Y P. Phylogeographic analysis of mtDNA variation in four ethnic populations from Yunnan Province: new data and a reappraisal. J Hum Genet, 2002, 47: 311-318 22 Richards M, Macaulay V, Hickey E, et al. Tracing founder lineages in the near Eastern mtDNA pool. A 23 Anderson S, Bankier A T, Barrell B G, et al. Sequence and organization of the human mitochondrial genome. Nature, 1981 290:457-465 24 Yao Y G, Watkins wS, Zhang Y P Evolutionary history of the mtDNA 9-bp deletion in Chinese populations and its relevance to the Peopling of East and Southeast Asia. Hum Genet, 2000, 107 504~512 25 Yao YG. Lo XM. Luo hr. et al. Gene admixture in the silk road 36 www.scichina.com
第 48 卷 第 6 期 2003 年 3 月 论 坛 636 www.scichina.com 19~30 5 Stone A C, Stoneking M. mtDNA analysis of prehistoric Oneota population: implications for the peopling of the new world. Am J Hum Genet, 1998, 62: 1153~1170 6 Hofreiter M, Serre D, Poinar H N, et al. Ancient DNA. Nat Rev Genet, 2001, 2: 353~359 7 Handt O, Krings M, Ward R H, et al. The retrieval of ancient human DNA sequences. Am J Hum Genet, 1996, 59: 368~376 8 Cooper A. Reply to Stoneking: ancient DNA—— how do you really know when you have it? Am J Hum Genet, 1997, 60: 1001~1002 9 Smith C I, Chamberlain A T, Riley M S, et al. Neanderthal DNA. Not just old but old and cold? Nature, 2001, 410: 771~772 10 Oota H, Saitou N, Matsushita T, et al. Molecular genetic analysis of remains of a 2000-year-old human population in China-and its relevance for the origin of the modern Japanese population. Am J Hum Genet, 1999, 64: 250~258 11 Wang L, Oota H, Saitou N, et al. Genetic structure of a 2,500-year-old human population in China and its spatiotemporal changes. Mol Biol Evol, 2000, 17: 1396~1400 12 Adcock G J, Dennis E S, Easteal S, et al. Mitochondrial DNA sequences in ancient Australians: implications for modern human origins. Proc Natl Acad Sci USA, 2001, 98: 537~542 13 崔银秋, 段然慧, 季朝能, 等. 交河故城古车师人的线粒体 DNA 分析. 高等学校化学学报, 2002, 23: 1510~1514 14 Cooper A, Rambaut A, Macaulay V, et al. Human origins and ancient human DNA. Science, 2001, 292: 1655~1656 15 Gutiérrez G, Sánchez D, Marín A. A reanalysis of the ancient mitochondrial DNA sequences recovered from Neandertal bones. Mol Biol Evol, 2002, 19: 1359~1366 16 葛剑雄, 曹树基, 吴松弟. 中国移民史. 福州: 福建人民出版社, 1997 17 Oota H, Kitano T, Jin F, et al. Extreme mtDNA homogeneity of continental Asian populations. Am J Phys Anthropol, 2002, 118: 146~153 18 Yao Y G, Kong Q P, Bandelt H J, et al. Phylogeographic differentiation of mitochondrial DNA in Han Chinese. Am J Hum Genet, 2002, 70: 635~651 19 Kivisild T, Tolk H, Parik J, et al . The emerging limbs and twigs of the east Asian mtDNA tree. Mol Biol Evol, 2002, 19: 1737~1751 20 Yao Y G, Kong Q P, Man X Y, et al. Reconstructing the evolutionary history of China: a caveat about inferences drawn from ancient DNA. Mol Biol Evol, 2003, 20(2): 214~219 21 Yao Y G, Zhang Y P. Phylogeographic analysis of mtDNA variation in four ethnic populations from Yunnan Province: new data and a reappraisal. J Hum Genet, 2002, 47: 311~318 22 Richards M, Macaulay V, Hickey E, et al. Tracing european founder lineages in the near Eastern mtDNA pool. Am J Hum Genet, 2000, 67: 1251~1276 23 Anderson S, Bankier A T, Barrell B G, et al. Sequence and organization of the human mitochondrial genome. Nature, 1981, 290: 457~465 24 Yao Y G, Watkins W S, Zhang Y P. Evolutionary history of the mtDNA 9-bp deletion in Chinese populations and its relevance to the Peopling of East and Southeast Asia. Hum Genet, 2000, 107: 504~512 25 Yao Y G, Lü X M, Luo H R, et al. Gene admixture in the silk road of China—— evidence from mtDNA and melanocortin 1 receptor polymorphism. Genes Genet Syst, 2000, 75: 173~178 26 Comas D, Calafell F, Mateu E, et al. Trading genes along the Silk Road: mtDNA sequences and the origin of Central Asian populations. Am J Hum Genet, 1998, 63: 1824~1838 27 Kolman C, Sambuughin N, Bermingham E. Mitochondrial DNA analysis of Mongolian populations and implications for the origin of new world founders. Genetics, 1996, 142: 1321~1334 28 Schurr T G, Sukernik R I, Starikovskaya Y B, et al. Mitochondrial DNA variation in Koryaks and Itel'men: population replacement in the Okhotsk Sea-Bering Sea region during the Neolithic. Am J Phys Anthropol, 1999, 108: 1~39 29 Derbeneva O A, Starikovskaya E B, Wallace D C, et al. Traces of early Eurasians in the Mansi of northwest Siberia revealed by mitochondrial DNA analysis. Am J Hum Genet, 2002, 70: 1009~1014 30 Oota H, Settheetham-Ishida W, Tiwawech D, et al. Human mtDNA and Y-chromosome variation is correlated with matrilocal versus patrilocal residence. Nat Genet, 2001, 29: 20~21 31 Lee S D, Lee Y S, Lee J B. Polymorphism in the mitochondrial cytochrome B gene in Koreans: an additional marker for individual identification. Int J Legal Med, 2002, 116: 74~78 32 Silva Jr W A, Bonatto S L, Holanda A J, et al. Mitochondrial genome diversity of Native Americans supports a single early entry of founder populations into America. Am J Hum Genet, 2002, 71: 187~192 33 Clisson I, Keyser C, Francfort H P, et al. Genetic analysis of human remains from a double inhumation in a frozen kurgan in Kazakhstan (Berel site, Early 3rd Century BC). Int J Legal Med, 2002, 116: 304~308 34 Ovchinnikov I, Buzhilova A, Mednikova M, et al. Ethnic affinities of the ancient human Jety-Asar population by mitochondrial DNA analysis. Electrophoresis, 1999, 20: 1729~1732 35 Yao Y G, Nie L, Harpending H, et al. Genetic relationship of Chinese ethnic populations revealed by mtDNA sequence diversity. Am J Phys Anthropol, 2002, 118: 63~76 36 Imaizumi K, Parsons T J, Yoshino M, et al. A new database of mitochondrial DNA hypervariable regions Ⅰand Ⅱ sequences from 162 Japanese individuals. Int J Legal Med, 2002, 116: 68~73 (2002-11-14 收稿, 2003-01-16 收修改稿)