植物遗传资源学报2019,20(6)1355-1371 Journal of plant genetic resources DO1:10.13430 cnki. jpg20190822001 主要农作物驯化硏究进展与展望 贾冠清,孟强,汤沙,张仁梁 (中国农业科学院作物科学研究所,北京100081) 摘要:农作物的驯化过程与农耕文明的发端密切相关,是作物种质资源遗传基础不断丰富衍化,利用价值不断完善 要途径之一。本文重点从作物驯化的主要性状、基因组遗传区段、重要驯化基因的克隆、作物驯化后的传播与基因渗透、作物 驯化理论与研究方法以及作物驯化硏究的新趋势等方面评述近年来取得的主要硏究进展,讨论硏究存在的主要问题并对深入 开展作物驯化研究进行展望。 关键词:作物驯化;形态学性状位点;数量性状;基因克隆 Current Advances and Future Perspectives on Crop domestication JIA Guan-qing, MENG Qiang, TANG Sha, ZHANG Ren-liang Institute of Crop Sciences, Chinese Academy of Agricultural Sciences, Beijing 100081 Abstract: Crop domestication has laid the fundamental basis of agricultural initiation and human civilization. Taking advantage of recent achievements on studies of crop domestication, this article reviewed the characterization of major domesticated-associated morphological traits, identification of important genomic segments, and isolation of domestication genes as well as the global spreading of cultivated crops post domestication. Furthermore, the advances on theoretical principals and fundamental methodologies as well current research focuses have been reviewed, and the future perspectives have been proposed Key words: crop domestication; morphological traits; QTL; gene cloning 人类文明的发展进步经历了直立行走、工具的然而,在作物的驯化过程中,究竟发生了什么?作物 使用、狩猎采摘以及种养农业等发展阶段。大约距是如何从野生状态(野生近缘种)逐渐演变成栽培状 今1万多年前,人类社会经历了从游动性的猎取采态(地方品种)并被人类选择利用的?这些科学问题 摘到相对定居性的种养农业的生产生活方式的转至今仍然没有得到确切的答案。近年来,围绕作物的 变口,这一转变过程最突出的特征便是大量作物被驯化过程,一些遗传学研究已经深入展开,为解开农 驯化栽培。已有的考古及作物多样性研究证据表作物驯化之谜提供了大量实验线索和判定依据。 明,主要农作物的驯化存在多个起源中心241:中东 新月沃地区起源了多种麦类作物(大麦、小麦、燕麦1作物驯化性状的解析 等),中国起源了大量的粮食作物(谷子、糜子、水稻、1.1驯化综合表征 大豆等),北美墨西哥地区起源了玉米,南美起源了 驯化综合表征是指作物由野生状态驯化为栽培 甘薯、马铃薯和花生等作物,非洲中部起源了高粱等状态后,表型性状的综合改变5一般情况下,野 作物。这些古老作物的驯化极大丰富了人类的膳食生种经过人为的选择和驯化后,往往表现为落粒性 结构,为人类文明的繁衍发展提供了食物安全保障。的丢失6、分支分蘗性的减少3、果实增大{9、种 收稿日期:2019-08-22修回日期:2019-09-20网络出版日期:2019-0909 Url:http://doiorg/10.13430/j.cnki.jpgr.2019082200 第一作者研究方向为谷子基因资源发掘,E-mail:jiaguanqing@caas.cn 基金项目:国家重点研发计划(2018YFD1000706,2018YFD00070);国家自然科学基金(31871630,31522040);国家谷子高粱产业技术体系 (CARS06-13.5-A4) Foundation project: National Key R&D Program of China(2018YFD1000706, 2018YFD1000700), National Natural Science Foundation (31871630, 31522040), China Agriculture Research System( CARS-06-135A4
植物遗传资源学报 2019,20(6):1355-1371 Journal of Plant Genetic Resources DOI:10.13430/j.cnki.jpgr.20190822001 主要农作物驯化研究进展与展望 贾冠清,孟 强,汤 沙,张仁梁 (中国农业科学院作物科学研究所,北京 100081) 摘要:农作物的驯化过程与农耕文明的发端密切相关,是作物种质资源遗传基础不断丰富衍化,利用价值不断完善的主 要途径之一。本文重点从作物驯化的主要性状、基因组遗传区段、重要驯化基因的克隆、作物驯化后的传播与基因渗透、作物 驯化理论与研究方法以及作物驯化研究的新趋势等方面评述近年来取得的主要研究进展,讨论研究存在的主要问题并对深入 开展作物驯化研究进行展望。 关键词:作物驯化;形态学性状位点;数量性状;基因克隆 Current Advances and Future Perspectives on Crop Domestication JIA Guan-qing,MENG Qiang,TANG Sha,ZHANG Ren-liang (Institute of Crop Sciences,Chinese Academy of Agricultural Sciences,Beijing 100081) Abstract:Crop domestication has laid the fundamental basis of agricultural initiation and human civilization.Taking advantage of recent achievements on studies of crop domestication,this article reviewed the characterization of major domesticated-associated morphological traits,identification of important genomic segments,and isolation of domestication genes as well as the global spreading of cultivated crops post domestication.Furthermore,the advances on theoretical principals and fundamental methodologies as well current research focuses have been reviewed,and the future perspectives have been proposed. Key words:crop domestication;morphological traits;QTL;gene cloning 收稿日期:2019-08-22 修回日期:2019-09-20 网络出版日期:2019-09-09 URL:http://doi.org/10.13430/j.cnki.jpgr.20190822001 第一作者研究方向为谷子基因资源发掘,E-mail :jiaguanqing@caas.cn 基金项目:国家重点研发计划(2018YFD1000706,2018YFD1000700);国家自然科学基金(31871630,31522040);国家谷子高粱产业技术体系 (CARS-06-13.5-A4) Foundation project:National Key R&D Program of China(2018YFD1000706,2018YFD1000700),National Natural Science Foundation (31871630,31522040),China Agriculture Research System(CARS-06-13.5-A4) 人类文明的发展进步经历了直立行走、工具的 使用、狩猎采摘以及种养农业等发展阶段。大约距 今 1 万多年前,人类社会经历了从游动性的猎取采 摘到相对定居性的种养农业的生产生活方式的转 变[1] ,这一转变过程最突出的特征便是大量作物被 驯化栽培。已有的考古及作物多样性研究证据表 明,主要农作物的驯化存在多个起源中心[2-4]:中东 新月沃地区起源了多种麦类作物(大麦、小麦、燕麦 等),中国起源了大量的粮食作物(谷子、糜子、水稻、 大豆等),北美墨西哥地区起源了玉米,南美起源了 甘薯、马铃薯和花生等作物,非洲中部起源了高粱等 作物。这些古老作物的驯化极大丰富了人类的膳食 结构,为人类文明的繁衍发展提供了食物安全保障。 然而,在作物的驯化过程中,究竟发生了什么?作物 是如何从野生状态(野生近缘种)逐渐演变成栽培状 态(地方品种)并被人类选择利用的?这些科学问题 至今仍然没有得到确切的答案。近年来,围绕作物的 驯化过程,一些遗传学研究已经深入展开,为解开农 作物驯化之谜提供了大量实验线索和判定依据。 1 作物驯化性状的解析 1.1 驯化综合表征 驯化综合表征是指作物由野生状态驯化为栽培 状态后,表型性状的综合改变[5] 。一般情况下,野 生种经过人为的选择和驯化后,往往表现为落粒性 的丢失[6] 、分支分蘖性的减少[7-8] 、果实增大[9] 、种
1356 植物遗传资源学报 卷 子休眠性的丧失0、株型的直立与强壮121、籽粒豆、菜豆等作物中(表2)。其中,二代基因组测序技 灌浆增加{311等综合的改变,在自然和人工选择压术结合核心种质群体的群体遗传分析已经成为主 力下,驯化综合表征特指现存的野生近缘种与地方流,代表性的进展如: Huang等采用二代基因组 品种间的表型差异,该差异一般显著大于野生近缘重测序手段,通过系统解析野生稻群体与栽培稻群 种与地方品种群体内部的性状遗传差异,并表现体的全基因组核酸多样性的变异情况,解析出了55 出在野生近缘种和地方品种间非连续变异的特征。个水稻受到驯化选择的基因组区段,并且通过分析 已有的遗传研究表明,多数驯化综合表征性状是由发现,水稻已知驯化相关基因如BH4(种皮色)SH4 单基因或少数主效基因位点控制的,并且遗传效应(落粒性)、 PROG I(匍匐生长习性)、qSW5(种子宽 不受遗传背景和环境因素的影响6] 度)、OsC(叶鞘颜色)等均位于这些驯化相关基因 12作物特色驯化性状 组区段内,该研究从侧面证实了采用群体遗传分析 除了上述提到的性状外,驯化综合表征在不同手段解析作物驯化相关遗传区段的准确性、有效性 作物驯化过程中的表现并不完全相同。例如在水稻和必要性; Hufford等采用二代基因组重测序技 中,野生稻驯化为栽培稻往往经历了由匍匐生长向直术,解析出了484个与玉米驯化紧密相关的基因组 立生长的转变2、芒长的变短m穗型结构的变区段,这些基因组区段占到玉米基因组的76%,平 化籽实灌浆能力1的变化等过程;在玉米中,主要均长度为322kb,平均涵盖34个注释基因结果显 经历了株型、穗型及行粒数的改变20,籽粒外稃消示,玉米驯化过程中,存在除了TB(分支分蘖性) 失1,颖壳硬度降低(21等过程;小麦中经历了穗粒TG4(坚硬外稃)等已知基因之外的更多的基因, 数与易收获性的改变3;大豆经历了种皮透水性增有待进行深入的解析和研究,为深入认识和分析玉 强1,无限生长习性的克服的过程;谷子则经历了米的驯化过程提供了候选基因组区段;Zhou等3 抽穗期的延迟、穗粒数的增多、刚毛变短等过程;高采用二代基因组重测序技术,使用 XP-CLR算法 粱则表现了茎秆持汁性增强的变化等。可以说,分析出了121个与大豆驯化直接相关的基因组位 不同作物的驯化性状具有鲜明的特色性,提示我们不点,并且发现这些驯化基因组位点与多个已知驯化 同作物可能经历了完全不同的驯化过程(表1 基因位置重合,得到的驯化区段定位精度远远超过 表1主要作物驯化相关性状 传统QL分析方法,具有更高的解析效率。该研究 Table 1 Domestication-related traits of important crop 同时采用了全基因组关联分析的手段,发现了多个 控制大豆籽粒油分含量,籽粒重量及茎秆建成紧密 粒用作物根及块茎作物果实作物相关的信号位点受到了驯化选择,为认识大豆的驯 Seed crop Root and tuber Fruit化过程提供了候选基因组区段; Schmutz等2采用 驯化性状种子大小 味改变风味改变二代基因组重测序技术对菜豆种质资源开展研究, 养分调配 养分调配养分调配利用滑框分析方法,获得了930个在野生种及栽培 种皮厚度,柔软度 淀粉含量 种子大小 种间基因组多样性参数及选择分化系数显著差异 穗型、穗数 适种性 果实大小 分支数量 繁殖周期 的基因组区段,累积影响了超过74Mb的菜豆基因 休眠性 果实硬度组,约占整个菜豆基因组的八分之一。此外,还发现 落粒性 了209个驯化区段的平均长度超过100kb,系统解 有限生长习性 析了普通菜豆两个独立驯化亚群的驯化区段相似 修改自参考文献231 度,提出了菜豆两次独立驯化的遗传证据;Li等131 fied from reference[21 采用二代基因组测序技术对桃种质资源开展测序 2作物驯化基因研究 采用滑框分析方法,鉴定出了142个在野生种及栽 培种间基因组多样性参数极显著差异的基因组区 21驯化相关基因组位点研究进展 段,累积影响了超过424Mb的桃基因组,约占整个 目前,对作物驯化基因组区段的解析研究主要桃基因组的186%。通过全基因组关联分析,鉴定 通过基于基因组重测序的群体遗传学分析途径和基出了多个与桃果实大小和风味相关的遗传位点受到 于连锁遗传理论的数量性状位点研究手段开展,近了驯化选择。这一研究为认识桃的驯化起源过程提 年来取得的突破性进展主要集中在水稻、玉米、大供了新的遗传证据
1356 植 物 遗 传 资 源 学 报 20 卷 子休眠性的丧失[10] 、株型的直立与强壮[11-12] 、籽粒 灌浆增加[13-14] 等综合的改变,在自然和人工选择压 力下,驯化综合表征特指现存的野生近缘种与地方 品种间的表型差异,该差异一般显著大于野生近缘 种与地方品种群体内部的性状遗传差异[15] ,并表现 出在野生近缘种和地方品种间非连续变异的特征。 已有的遗传研究表明,多数驯化综合表征性状是由 单基因或少数主效基因位点控制的,并且遗传效应 不受遗传背景和环境因素的影响[16] 。 1.2 作物特色驯化性状 除了上述提到的性状外,驯化综合表征在不同 作物驯化过程中的表现并不完全相同。例如在水稻 中,野生稻驯化为栽培稻往往经历了由匍匐生长向直 立生长的转变[11-12] 、芒长的变短[17] 、穗型结构[18] 的变 化、籽实灌浆能力[13] 的变化等过程;在玉米中,主要 经历了株型[19] 、穗型及行粒数的改变[20] ,籽粒外稃消 失[21] ,颖壳硬度降低[22] 等过程;小麦中经历了穗粒 数与易收获性的改变[23];大豆经历了种皮透水性增 强[24] ,无限生长习性的克服[25] 的过程;谷子则经历了 抽穗期的延迟、穗粒数的增多、刚毛变短等过程[26] ;高 粱则表现了茎秆持汁性增强[27] 的变化等。可以说, 不同作物的驯化性状具有鲜明的特色性,提示我们不 同作物可能经历了完全不同的驯化过程(表 1)。 表 1 主要作物驯化相关性状 Table 1 Domestication-related traits of important crop species 粒用作物 Seed crop 根及块茎作物 Root and tuber 果实作物 Fruit 驯化性状 Traits 种子大小 养分调配 种皮厚度,柔软度 穗型、穗数 产量 休眠性 落粒性 有限生长习性 风味改变 养分调配 淀粉含量 适种性 分支数量 风味改变 养分调配 种子大小 果实大小 繁殖周期 果实硬度 修改自参考文献[28] Modified from reference[28] 2 作物驯化基因研究 2.1 驯化相关基因组位点研究进展 目前,对作物驯化基因组区段的解析研究主要 通过基于基因组重测序的群体遗传学分析途径和基 于连锁遗传理论的数量性状位点研究手段开展,近 年来取得的突破性进展主要集中在水稻、玉米、大 豆、菜豆等作物中(表 2)。其中,二代基因组测序技 术结合核心种质群体的群体遗传分析已经成为主 流,代表性的进展如:Huang 等[29]采用二代基因组 重测序手段,通过系统解析野生稻群体与栽培稻群 体的全基因组核酸多样性的变异情况,解析出了 55 个水稻受到驯化选择的基因组区段,并且通过分析 发现,水稻已知驯化相关基因如 BH4(种皮色)、SH4 (落粒性)、PROG1(匍匐生长习性)、qSW5(种子宽 度)、OsC1(叶鞘颜色)等均位于这些驯化相关基因 组区段内,该研究从侧面证实了采用群体遗传分析 手段解析作物驯化相关遗传区段的准确性、有效性 和必要性;Hufford 等[30] 采用二代基因组重测序技 术,解析出了 484 个与玉米驯化紧密相关的基因组 区段,这些基因组区段占到玉米基因组的 7.6%,平 均长度为 322 kb,平均涵盖 3.4 个注释基因,结果显 示,玉米驯化过程中,存在除了 TB1(分支分蘖性)、 TGA1(坚硬外稃)等已知基因之外的更多的基因, 有待进行深入的解析和研究,为深入认识和分析玉 米的驯化过程提供了候选基因组区段;Zhou 等[31] 采用二代基因组重测序技术,使用 XP-CLR 算法, 分析出了 121 个与大豆驯化直接相关的基因组位 点,并且发现这些驯化基因组位点与多个已知驯化 基因位置重合,得到的驯化区段定位精度远远超过 传统 QTL 分析方法,具有更高的解析效率。该研究 同时采用了全基因组关联分析的手段,发现了多个 控制大豆籽粒油分含量,籽粒重量及茎秆建成紧密 相关的信号位点受到了驯化选择,为认识大豆的驯 化过程提供了候选基因组区段;Schmutz 等[32] 采用 二代基因组重测序技术对菜豆种质资源开展研究, 利用滑框分析方法,获得了 930 个在野生种及栽培 种间基因组多样性参数及选择分化系数显著差异 的基因组区段,累积影响了超过 74 Mb 的菜豆基因 组,约占整个菜豆基因组的八分之一。此外,还发现 了 209 个驯化区段的平均长度超过 100 kb,系统解 析了普通菜豆两个独立驯化亚群的驯化区段相似 度,提出了菜豆两次独立驯化的遗传证据;Li 等[33] 采用二代基因组测序技术对桃种质资源开展测序, 采用滑框分析方法,鉴定出了 142 个在野生种及栽 培种间基因组多样性参数极显著差异的基因组区 段,累积影响了超过 42.4 Mb 的桃基因组,约占整个 桃基因组的 18.6%。通过全基因组关联分析,鉴定 出了多个与桃果实大小和风味相关的遗传位点受到 了驯化选择。这一研究为认识桃的驯化起源过程提 供了新的遗传证据
贾冠清等:主要农作物驯化研究进展与展望 1357 表2主要作物驯化基因组位点的定位与鉴定 Table 2 Identification of genomic segments associated with crop domestication 种质(群体)数量种质(群体)类型驯化区段或 分析内容 参考文献 Crops Type of accessions QT accessions( families)( families) Number of QTLs Methods Analysis performed Reference 水稻 野生种(446),地 代基因组重测序,SNP鉴定,Fx,全基因[29] 方品种(1083) 测序深度:野生种(平组关联分析,进化树,主 均2×),地方品种成分分析,遗传多样性 (平均1×) (),选择性鉴定(T T。),遗传距离 野生种(22),地 二代基因组重测序,SNP鉴定,遗传多样性[34] 方品种(44) 测序深度:野生种(平(8),Fsr,LDRs 均1.5×),地方品种 (平均1.5×) 玉米 野生种(17),地 代基因组重测序,SNP鉴定,F,进化树,[30] Maize 方品种(23),育 测序深度:野生种(平连锁不平衡, XP.CLR 成品种(35) 均5×).地方品种遗传多样性() (平均5×).育成品种 (平均5×) 野生种ⅹ栽培 72个 SNP标记 Q∏L定位,比较遗传[35] 种,BC2S3RILs 小析 野生种(62),地 代基因组重测序,SNP鉴定,Fx,主成分分[31] Soybean 方品种(130),育 测序深度:野生种(平析,进化树,遗传多样性 成品种(110) 均11x),地方品种(m),CNV,连锁不平 (平均11×),育成品衡, XP-CLR,全基因组 种(平均11×) 关联分析,选择性鉴定 野生种(72),地 140个 SLAF基因组重测序,SNP鉴定,进化树,群36] 方品种(36),育 测序深度:野生种(平体结构,遗传多样性 成品种(404) 均6.4×).地方品种(), Fu and L'sD* (平均6.14×),育成 Fu and li'sF*,主 品种(平均6.14×)分析,Fsr,连锁不平衡 基因流动,全基因组关 联分析,选择性鉴定 野生种(8),地方 394个 代基因组重测序,SNP鉴定,群体结构,[37] 品种(8),育成品 测序深度:野生种(平进化树,Fsr,遗传多样 种(9) 均5x),地方品种性(m),主成分分析 (平均5×),育成品种选择性鉴定(/m。) 野生种(6),地方206个 代基因组重测序,SNP鉴定,Fx,进化树,[38 品种(4).育成品 测序深度:野生种(平遗传多样性()选择 种(6) 均17×),地方品种性鉴定(。/。) (平均17×),育成品 种(平均17×) 野生种(60),地 930个 二代基因组重测序,SNP鉴定,CNV,遗传[32] 方品种(100) 测序深度:野生种(平多样性(m),全基因组 均4x),地方品种关联分析选择性鉴定, (平均4 连锁不平衡
6 期 贾冠清等:主要农作物驯化研究进展与展望 1357 表 2 主要作物驯化基因组位点的定位与鉴定 Table 2 Identification of genomic segments associated with crop domestication 作物 Crops 种质(群体)数量 Amount of accessions(families) 种质(群体)类型 Type of accessions (families) 驯化区段或 QTLs Number of QTLs 鉴定手段 Methods 分析内容 Analysis performed 参考文献 Reference 水稻 Rice 1529 野生种(446),地 方品种(1083) 55 个 二代基因组重测序, 测序深度:野生种(平 均 2×),地 方 品 种 (平均 1×) SNP 鉴定,FST,全基因 组关联分析,进化树,主 成分分析,遗传多样性 (π),选择性鉴定(πw / πc),遗传距离 [29] 66 野 生 种(22),地 方品种(44) 399 个 二代基因组重测序, 测序深度:野生种(平 均 1.5×),地 方 品 种 (平均 1.5×) SNP 鉴定,遗传多样性 (θ),FST,LDRs, [34] 玉米 Maize 75 野 生 种(17),地 方 品 种(23),育 成品种(35) 484 个 二代基因组重测序, 测序深度:野生种(平 均 5×),地 方 品 种 (平均 5×),育成品种 (平均 5×) SNP 鉴定,FST,进化树, 连锁不平衡,XP-CLR, 遗传多样性(π) [30] 866 野生种×栽培 种,BC2S3 RILs 72 个 QTLs SNP 标记 QTL 定 位,比 较 遗 传 分析 [35] 大豆 Soybean 302 野 生 种(62),地 方品种(130),育 成品种(110) 121 个 二代基因组重测序, 测序深度:野生种(平 均 11×),地 方 品 种 (平均 11×),育成品 种(平均 11×) SNP 鉴定,FST,主成分分 析,进化树,遗传多样性 (π),CNV,连 锁 不 平 衡,XP-CLR,全基因组 关联分析,选择性鉴定 [31] 512 野 生 种(72),地 方 品 种(36),育 成品种(404) 140 个 SLAF 基因组重测序, 测序深度:野生种(平 均 6.14×),地方品种 (平 均 6.14×),育 成 品种(平均 6.14×) SNP 鉴 定,进 化 树,群 体 结 构,遗 传 多 样 性 (π),Fu and Li′s D*, Fu and Li′s F*,主 成 分 分析,FST,连锁不平衡, 基因流动,全基因组关 联分析,选择性鉴定 [36] 25 野生种(8),地方 品种(8),育成品 种(9) 394 个 二代基因组重测序, 测序深度:野生种(平 均 5×),地 方 品 种 (平均 5×),育成品种 (平均 5×) SNP 鉴 定,群 体 结 构, 进化树,FST,遗传多样 性(π),主成分分析, 选择性鉴定(πw /πc) [37] 16 野生种(6),地方 品种(4),育成品 种(6) 206 个 二代基因组重测序, 测序深度:野生种(平 均 17×),地 方 品 种 (平均 17×),育成品 种(平均 17×) SNP 鉴定,FST,进化树, 遗传多样性(π),选择 性鉴定(πw /πc) [38] 菜豆 Common bean 160 野 生 种(60),地 方品种(100) 930 个 二代基因组重测序, 测序深度:野生种(平 均 4×),地 方 品 种 (平均 4×) SNP 鉴 定,CNV,遗 传 多样性(π),全基因组 关联分析,选择性鉴定, 连锁不平衡 [32]
1358 植物遗传资源学报 卷 表2(续) 作物 种质(群体)数量种质(群体)类型驯化区段或 Type of accessions 鉴定手段 分析内容 参考文献 Amount o QTLs Crops Methods accessions( families families Number of QTls Analysis performed Reference 野生种(52)地 代基因组重测序,SNP鉴定,主成分分析,[33 方品种(213),育 测序深度:野生种(平进化树,Fsr,遗传多样 品种(215) 均64×),地方品种性(τ),连锁不平衡,全 (平均64X)育成品基因组关联分析,选择 种(平均6.4×) 性鉴定(w/m。),CLR 梨 种(57)地 代基因组重测序,SNP鉴定,主成分分[39] 方品种(56)(候选基因)测序深度:野生种(平析,进化树,Fsr,遗传 均11×),地方品种多样性(m),连锁不平 (平均11×) 衡,基因漂流,ROD,群 体结构,IBD 柑橘 野生种(13) 1600个二代基因组重测序,主成分分析,进化树,[40] Orans 地方品种(91) 测序深度:野生种(平Fx,遗传多样性() 均35×),地方品种SNP鉴定, XP-CLR,基 (平均35×) 因漂流 野生种(5)地方 代基因组重测序,SNP鉴定,主成分分析 Cotton 品种(43),育成 测序深度:野生种(平进化树,群体结构,F 品种(95) 均5.17×)地方品种遗传多样性(m),选择 (平均517×),育成性鉴定(c/m 品种(平均5.17×) 大麦 野生种(344),地137个 umina enrichment SNP鉴定,主成分分[42] 方品种(89) 析,群体结构,CLR,遗 传多样性(T),选择性 鉴定(w/re) 野生种(188) 个SNP芯片 SNP鉴定,Fr,lnRH,进[43] 地方品种(84) 匕树 育成品种(429) 野生种ⅹ栽培 7个Q∏ LS SSR及DArT Q∏定位,比较遗传[44] 种,RI 谷子 野生种x栽培10个 QTLs SNP,SSR及 RFLPS QTL定位,上位性效应,[16] Foxtail millet 环境互作效应 饭豆 野生种×栽培73个 QTLS SSR及AFLP Q∏定位,比较遗传[45] Rice bean 种,BC1F1 188(F2)/190野生种x栽培153个QTLs QL定位,比较遗传[46 Yardlong bean (BC FI) 种,F2及BC1F1 分析 花生 142(87BCJF1and野生种x栽培95个 QTLs SSR Q∏L定位,比较遗传[47] Peanu 55BC2F2) 种,44BC2F1 分析 野生种x栽培61个 QTLs Illumina Golden Gate,Q∏定位,比较遗传[48] Safflower 种,F SNP 分析
1358 植 物 遗 传 资 源 学 报 20 卷 作物 Crops 种质(群体)数量 Amount of accessions(families) 种质(群体)类型 Type of accessions (families) 驯化区段或 QTLs Number of QTLs 鉴定手段 Methods 分析内容 Analysis performed 参考文献 Reference 桃 Peach 480 野生种(52),地 方品种(213),育 成品种(215) 142 个 二代基因组重测序, 测序深度:野生种(平 均 6.4×),地 方 品 种 (平均 6.4×),育成品 种(平均 6.4×) SNP 鉴定,主成分分析, 进化树,FST,遗传多样 性(π),连锁不平衡,全 基因组关联分析,选择 性鉴定(πw /πc),CLR [33] 梨 Pear 113 野生种(57),地 方品种(56) 1082 个 (候选基因) 二代基因组重测序, 测序深度:野生种(平 均 11×),地 方 品 种 (平均 11×) SNP 鉴 定,主 成 分 分 析,进 化 树,FST,遗 传 多样性(π),连锁不平 衡,基因漂流,ROD,群 体结构,IBD [39] 柑橘 Orange 104 野生种(13), 地方品种(91) 1600 个 二代基因组重测序, 测序深度:野生种(平 均 35×),地 方 品 种 (平均 35×) 主成分分析,进化树, FST,遗传多样性(π), SNP 鉴定,XP-CLR,基 因漂流 [40] 棉花 Cotton 143 野生种(5),地方 品种(43),育成 品种(95) 109 个 二代基因组重测序, 测序深度:野生种(平 均 5.17×),地方品种 (平 均 5.17×),育 成 品种(平均 5.17×) SNP 鉴定,主成分分析, 进化树,群体结构,FST, 遗传多样性(π),选择 性鉴定(πrace /πcultivar) [41] 大麦 Barley 433 野生种(344),地 方品种(89) 137 个 Illumina enrichment resequencing SNP 鉴 定,主 成 分 分 析,群体结构,CLR,遗 传多样性(π),选择性 鉴定(πw /πc) [42] 小麦 Wheat 701 野生种(188), 地方品种(84), 育成品种(429) 7984 个 SNP 芯片 SNP 鉴定,FST,lnRH,进 化树 [43] 152 野生种 × 栽培 种,RILs 27 个 QTLs SSR 及 DArT QTL 定 位,比 较 遗 传 分析 [44] 谷子 Foxtail millet 182 野生种 × 栽培 种,RILs 10 个 QTLs SNP,SSR 及 RFLPs QTL 定位,上位性效应, 环境互作效应 [16] 饭豆 Rice bean 198 野生种 × 栽培 种,BC1F1 73 个 QTLs SSR 及 AFLP QTL 定 位,比 较 遗 传 分析 [45] 长豇豆 Yardlong bean 188(F2)/190 (BC1F1) 野生种 × 栽培 种,F2 及 BC1F1 153 个 QTLs SSR QTL 定 位,比 较 遗 传 分析 [46] 花生 Peanut 142(87 BC3F1 and 55 BC2F2) 野生种 × 栽培 种,44 BC2F1 后代 95 个 QTLs SSR QTL 定 位,比 较 遗 传 分析 [47] 红花 Safflower 276 野生种 × 栽培 种,F2 61 个 QTLs Illumina GoldenGate, SNP QTL 定 位,比 较 遗 传 分析 [48] 表 2(续)
贾冠清等:主要农作物驯化研究进展与展望 1359 除群体遗传学硏究手段外,连锁遗传分析作为实际贡献很低,研究结果认为,作物的驯化过程之所 经典的遗传分析手段,仍然在驯化基因组区段解析以相对漫长,不是由于有限的驯化基因间的上位性 研究中发挥着基础性作用,如:Xu等3对玉米远互作导致的,也不是由于驯化基因位点过多,或单个 缘杂交衍生BC2S3群体开展了雄穗建成驯化性状位点效应过低导致的,而是可能与人类历史及文化 的Q∏Ls定位,明确了玉米雄穗驯化的关键控制位发展紧密相关。这一研究结果,使我们对作物驯化 点候选基因及其遗传与表型效应,为深入开展关键过程相对漫长的历史原因有了更加清晰的认识。 驯化基因的克隆奠定了基础; Doust等1采用连锁22驯化相关基因克隆进展 分析的方法,通过对一个谷子及其近缘野生种青狗 近年来,作物驯化相关基因克隆研究进展迅速, 尾草远缘杂交群体的精细鉴定,获得了2个控制落主要研究手段包括QIL克隆、全基因组关联分析及 粒性的主效Q∏L位点以及8个控制抽穗期的主效候选基因鉴定等(表3),其中QTL定位技术作为主 QTL位点,并对位点间的上位性互作效应进行了解流研究手段被广泛应用,在主要驯化性状关键基因 析,研究发现环境效应及上位性互作效应对表型的的克隆方面取得的代表性进展如下。 表3主要作物驯化基因克隆与功能分析 Table 3 Cloning and characterization of functional genes on crop domestication 是否存在 选择证据 作物 基因 基因类别 性状 变异类型 平行驯化 鉴定手段 参考文献 Genes Annotation its Types of variations Parallel Methods References on selection domestication SHAT转录因子落粒性蛋白移码突变未明确Q1L定位未明确 LHDI 转录因子抽穗期 氨基酸变化 未明确 Q定位未明确50] OsgI 转录因 顺式调控元件 未明确 QTL定位 未明确 LAB/ 细胞分裂素芒长 蛋白移码突变 未明确 QTL定位 活化酶 转录因子落粒性蛋白移码突变 未明确 QTL定位 未明确 OScIL 细胞壁蔗糖酶灌浆 氨基酸变化 未明确同源性分析有 膜蛋白株型穗型蛋白移码突变 未明确 [53] OsGSK 2 蛋白激酶中胚轴 氨基酸变化 未明确全基因组关联有 [54] 伸长 PROG 转录因子匍匐性 顺式调控 未明确 QL定位 [55] 核蛋白 木眠性 氨基酸变化 未明确 QTL定位 转运蛋白种皮色蛋白移码突变 未明确 有有有有 PROGI 转录因子 氨基酸改变 未明确 [112 (功能丧失) SwEET4己醣跨膜 灌浆 转录组结合 Maize 选择区段定位 UPA12 转录因子 株型 顺式调控 未明确 QTL定位 [58] 转录因子 型 顺式调控 [19.59] 转录因子 种子 〔基酸改变 未明确 裸露性 有有有有 转录因子花序结构不明确(很可能是未明确候选基因 顺式调控)
6 期 贾冠清等:主要农作物驯化研究进展与展望 1359 除群体遗传学研究手段外,连锁遗传分析作为 经典的遗传分析手段,仍然在驯化基因组区段解析 研究中发挥着基础性作用,如:Xu 等[35]对玉米远 缘杂交衍生 BC2S3 群体开展了雄穗建成驯化性状 的 QTLs 定位,明确了玉米雄穗驯化的关键控制位 点候选基因及其遗传与表型效应,为深入开展关键 驯化基因的克隆奠定了基础;Doust 等[16] 采用连锁 分析的方法,通过对一个谷子及其近缘野生种青狗 尾草远缘杂交群体的精细鉴定,获得了 2 个控制落 粒性的主效 QTL 位点以及 8 个控制抽穗期的主效 QTL 位点,并对位点间的上位性互作效应进行了解 析,研究发现环境效应及上位性互作效应对表型的 实际贡献很低,研究结果认为,作物的驯化过程之所 以相对漫长,不是由于有限的驯化基因间的上位性 互作导致的,也不是由于驯化基因位点过多,或单个 位点效应过低导致的,而是可能与人类历史及文化 发展紧密相关。这一研究结果,使我们对作物驯化 过程相对漫长的历史原因有了更加清晰的认识。 2.2 驯化相关基因克隆进展 近年来,作物驯化相关基因克隆研究进展迅速, 主要研究手段包括 QTL 克隆、全基因组关联分析及 候选基因鉴定等(表 3),其中 QTL 定位技术作为主 流研究手段被广泛应用,在主要驯化性状关键基因 的克隆方面取得的代表性进展如下。 表 3 主要作物驯化基因克隆与功能分析 Table 3 Cloning and characterization of functional genes on crop domestication 作物 Crops 基因 Genes 基因类别 Annotation 性状 Traits 变异类型 Types of variations 是否存在 平行驯化 Parallel domestication 鉴定手段 Methods 选择证据 Evidence on selection 参考文献 References 水稻 Rice SHAT1 转录因子 落粒性 蛋白移码突变 未明确 QTL 定位 未明确 [49] LHD1 转录因子 抽穗期 氨基酸变化 未明确 QTL 定位 未明确 [50] OsLG1 转录因子 穗型 顺式调控元件 未明确 QTL 定位 未明确 [18] LABA1 细胞分裂素 活化酶 芒长 蛋白移码突变 未明确 QTL 定位 有 [17] GL4 转录因子 落粒性 蛋白移码突变 未明确 QTL 定位 未明确 [51] OsCIN1 细胞壁蔗糖酶 灌浆 氨基酸变化 未明确 同源性分析 有 [52] qPE9-1 膜蛋白 株型穗型 蛋白移码突变 未明确 QTL 定位 未明确 [53] OsGSK2 蛋白激酶 中胚轴 伸长 氨基酸变化 未明确 全基因组关联 分析 有 [54] PROG7 转录因子 匍匐性 顺式调控 未明确 QTL 定位 有 [55] Sdr4 核蛋白 休眠性 氨基酸变化 未明确 QTL 定位 有 [56] Bh4 转运蛋白 种皮色 蛋白移码突变 未明确 QTL 定位 有 [57] PROG1 转录因子 株型 氨基酸改变 (功能丧失) 未明确 QTL 定位 有 [11-12] 玉米 Maize ZmSWEET4c 己醣跨膜 转运蛋白 灌浆 未明确 是 转录组结合 选择区段定位 有 [14] UPA2 转录因子 株型 顺式调控 未明确 QTL 定位 有 [58] tb1 转录因子 株型 顺式调控 是 QTL 定位 有 [19,59] tga1 转录因子 种子 裸露性 氨基酸改变 未明确 QTL 定位 有 [21] ra1 转录因子 花序结构 不明确(很可能是 顺式调控) 未明确 候选基因 有 [60]
植物遗传资源学报 卷 表3(续) 是否存在 选择证据 作物 基因 基因类别 性状 变异类型 平行驯化鉴定手段 参考文献 Evidence Crops Types of variations Parallel Methods on selection 小麦 转录因子落粒性和顺式调控及 未明确 Q定位未明确[61-62] Wheat 其他性状氨基酸改变 Vrml 顺式调控 未明确[63-64 Vrn2 转录因子春化氨基酸改变及 QTL 基因缺失 大豆 跨膜蛋白 种皮 氨基酸变化 未明确 QTL定位 [24] 渗透性 蛋白酶 休眠性 可变剪切 全基因组关联有 GIGANTEAa 核蛋白 蛋白移码及 未明确 同源性分析 SHATI-5 转录因子裂荚性 顺式调控 未明确同源性分析 有 [68] D 转录因子生长习性 氨基酸变化 候选基因未明确25] 高粱 转录因子落粒性顺式调控、蛋白 Q∏L定位未明确69] 终止与可变剪切 锌指和 抽穗期 蛋白移码突变 Q定位未明确[70 CCT蛋白 转录因子持汁性 蛋白缺失 未明确全基因组关联有 分析 转录因子穗发育 蛋白移码及 全基因组关联未明确 Barley 提前终止 Birl 跨膜蛋白 答粒性 蛋白移码突变 未明确 QTL定位 [72] CAR和PP落粒性蛋白移码突变 未明确 QTL定位 转录因子 棱形提前终止(插入 未明确 定位 缺失或改变氨基酸) 转录因子 染色体缺失 未明确 L定位 裸露性 番茄 ElDI F-box蛋白生物节律氨基酸变化 未明确 QL定位 Tomato SIKLUH P450蛋白果实大小 QTL定位 转录因子果实大小顺式调控 未明确 QL定位 黄瓜 转录因子果实苦味 顺式调控 未明确选择区段定位有 [78] Cucumber 向日葵 HaRTl 转录因子 花期 蛋白移码突变 未明确 候选基因 Sunfower QTL定位
1360 植 物 遗 传 资 源 学 报 20 卷 作物 Crops 基因 Genes 基因类别 Annotation 性状 Traits 变异类型 Types of variations 是否存在 平行驯化 Parallel domestication 鉴定手段 Methods 选择证据 Evidence on selection 参考文献 References 小麦 Wheat Q 转录因子 落粒性和 其他性状 顺式调控及 氨基酸改变 未明确 QTL 定位 未明确 [61-62] Vrn1 转录因子 春化 顺式调控 是 QTL 定位 未明确 [63-64] Vrn2 转录因子 春化 氨基酸改变及 基因缺失 是 QTL 定位 未明确 [65-66] 大豆 Soybean GmHs1-1 跨膜蛋白 种皮 渗透性 氨基酸变化 未明确 QTL 定位 有 [24] G 蛋白酶 休眠性 可变剪切 是 全基因组关联 分析 有 [10] GIGANTEAa 核蛋白 抽穗期 蛋白移码及 提前终止 未明确 同源性分析 有 [67] SHAT1-5 转录因子 裂荚性 顺式调控 未明确 同源性分析 有 [68] Dt1 转录因子 生长习性 氨基酸变化 是 候选基因 未明确 [25] 高粱 Sorghum Sh1 转录因子 落粒性 顺式调控、蛋白 终止与可变剪切 是 QTL 定位 未明确 [69] HD1 锌指和 CCT 蛋白 抽穗期 蛋白移码突变 是 QTL 定位 未明确 [70] Dry 转录因子 持汁性 蛋白缺失 未明确 全基因组关联 分析 有 [27] 大麦 Barley INT-C 转录因子 穗发育 蛋白移码及 提前终止 是 全基因组关联 分析 未明确 [71] Btr1 跨膜蛋白 落粒性 蛋白移码突变 未明确 QTL 定位 有 [72] Btr2 CAR 和 PIP 结构域蛋白 落粒性 蛋白移码突变 未明确 QTL 定位 有 [72] Vrs1 转录因子 棱形 提前终止(插入 / 缺失或改变氨基酸) 未明确 QTL 定位 有 [73] Nud 转录因子 籽粒 裸露性 染色体缺失 未明确 QTL 定位 有 [74] 番茄 Tomato EID1 F-box 蛋白 生物节律 氨基酸变化 未明确 QTL 定位 有 [75] SlKLUH (fw3.2) P450 蛋白 果实大小 顺式调控 是 QTL 定位 有 [76] fas 转录因子 果实大小 顺式调控 未明确 QTL 定位 有 [77] 黄瓜 Cucumber Bt 转录因子 果实苦味 顺式调控 未明确 选择区段定位 有 [78] 向日葵 Sunflower HaFT1 转录因子 花期 蛋白移码突变 未明确 候选基因, QTL 定位 有 [79] 表 3(续)
贾冠清等:主要农作物驯化研究进展与展望 1361 221落粒性在水稻中,Zhou等利用一个野中,相同性状的驯化机制可能是完全不同的。 生稻染色体片段渗入系S14,采用Coy-射线处22株型穗型在水稻中,Zhu等以特青为 理,获得了落粒渗入系的不落粒突变体shI,经过受体亲本,利用野生稻染色体片段渗人系Y31构 图位克隆分析,发现突变基因SHAT′编码一个AP2建的重组分离群体,采用图位克隆的技术手段,克 家族蛋白,该基因的第1个外显子区41~42位碱基隆了控制水稻松散穗型基因 OsLO I,该基因编码 处发生的单碱基缺失导致了移码突变和蛋白翻译个 SBP-domain家族转录因子蛋白。研究发现, 的提前终止。由于SHA可特异地维持水稻穗部在野生稻和栽培稻群体间,OsLG/上游调控区存 小花枝梗离层的形成,突变体无法产生离层,从而在的一个单碱基替换导致了水稻穗型由野生稻的 克服了落粒性的产生。进一步的研究发现,SHAT松散型驯化为栽培水稻的紧凑型,揭示了人类对作 的表达受到SH4的调控,并且SHAT/和SH4作用物驯化基因的选择完全可以发生在顺式调控元件 于qSH的上游,共同影响水稻离层的分化形成;区域,并且这样的选择类型非常高效;Hua等 Wu等s以非洲栽培稻为研究对象,通过构建非93-11为受体亲本,创制鉴定野生稻染色体片段渗 洲野生稻的染色体片段渗入系,对一个控制落粒性入系9YIL304,具有芒长增加的表型,图位克隆了控 的QL位点进行了图位克隆,分离得到了一个水制基因 LABAI,发现该基因编码一个细胞分裂素活 稻新的落粒基因GL4,该基因编码一个MYB家族化酶,在栽培水稻中,由于该基因发生的一个移码突 转录因子,基因编码区的一个单碱基突变导致了栽变,导致细胞分裂素含量在芒生长原基中的含量减 培稻中编码蛋白的提前终止,穗部小花枝梗离层无低,从而使栽培水稻芒长变短。序列分析结果表明 法形成,从而克服了落粒性的产生。这一研究结LABA附近存在一个800kb的核酸序列多样性选 果为深入认识非洲栽培稻的驯化过程提供了基础择清除区域,单倍型溯源分析结果表明,LABA最 数据。 先在粳稻中被驯化选择,之后扩散渗入到籼稻中,提 在高粱中,Lin等构建了一个远缘杂交群示该基因在水稻驯化的早期受到了人工选择。 体,采用图位克隆技术手段,克隆了高粱落粒性控 在玉米中, Studer等)对玉米驯化基因TBl 制基因S,编码一个 YABBY家族转录因子,在栽的遗传机制进行了深入的研究,通过远缘杂交手段 培高粱中,共检测到了3种不同的功能弱化变异,获得了18个TBl基因组区段的玉米一大刍草基因 包括启动子区出现的碱基变异导致表达量的降低,区段重组单株,并获得了这18个重组基因组区段的 编码区22kb片段的缺失导致产生截断的蛋白,以近等基因系,通过遗传效应分析,结合多样性变异 及内含子区的一个“ GT-to-GG”变异导致的可变剪发现一个 Hopscotch转座元件插入到了TB/基因的 切。Sh/单倍型分析结果提示高粱可能具有3次独上游,并且通过影响TBl的表达量控制分支分蘖性 立的起源。深人的研究分析发现,水稻中的同源基的改变。单倍型分析结果证实了在栽培玉米中几 因OsSh和玉米中的同源基因ZmSh-1和ZmSh-乎都含有这一 Hopscotch转座元件,而野生种大刍 5|+ZmSh1-5.2具有相同的功能。这一研究结果支草中却几乎没有这一转座元件。分子时钟分析结 持在高粱、水稻和玉米中存在落粒基因位点的平行果表明, Hopscotch转座元件的插入时间至少距今 驯化选择的推论。 万年,远在玉米驯化之前。研究结果证实了正是 在大麦中, Pourkheirandish等通过利用野生由于人类对这一转座元件插入事件的选择,推动了 大麦与栽培大麦的远缘杂交群体,采用图位克隆的玉米的驯化进程,结果也再次验证了转座元件是物 方法,克隆了大麦落粒基因Bm1和Br2。其中基因种基因组进化的主要动力;Tian等3采用图位克 Bt编码—个跨膜蛋白,Bm2编码了一个具有CAR隆技术,定位克隆了控制玉米叶片夹角的关键驯化 和PIP结构域的可溶性蛋白。研究发现在Bm和基因UPA2,并证实了这一主效位点在玉米的驯化 Bm2中分别发生了1bp和1lbp的碱基缺失,导致过程中被选择丢失了,该位点变异发生在 ZmRAVLI 翻译蛋白不完整,从而使栽培大麦获得了不落粒的基因的上游调控区,是一个2bp的碱基插入,可以 特性。形态解剖观察结果表明,大麦的落粒性是由导致玉米叶夹角变小,并通过研究发现,该驯化基 于小穗轴部细胞的细胞壁过薄导致穗轴过脆,从而因的育种应用可以显著提高玉米在密植条件下的 产生的落粒现象,与水稻中由于离层的产生导致的产量水平; Bommert等0利用 TILLING技术,验 落粒机制完全不同,这也从侧面揭示了在不同作物证了玉米控制果穗行粒数的驯化基因 FASCIATED
6 期 贾冠清等:主要农作物驯化研究进展与展望 1361 2.2.1 落粒性 在水稻中,Zhou 等[49]利用一个野 生稻染色体片段渗入系 SL4,采用 60Co γ- 射线处 理,获得了落粒渗入系的不落粒突变体 shat1,经过 图位克隆分析,发现突变基因 SHAT1 编码一个 AP2 家族蛋白,该基因的第 1 个外显子区 41~42 位碱基 处发生的单碱基缺失导致了移码突变和蛋白翻译 的提前终止。由于 SHAT1 可特异地维持水稻穗部 小花枝梗离层的形成,突变体无法产生离层,从而 克服了落粒性的产生。进一步的研究发现,SHAT1 的表达受到 SH4 的调控,并且 SHAT1 和 SH4 作用 于 qSH1 的上游,共同影响水稻离层的分化形成; Wu 等[51]以非洲栽培稻为研究对象,通过构建非 洲野生稻的染色体片段渗入系,对一个控制落粒性 的 QTL 位点进行了图位克隆,分离得到了一个水 稻新的落粒基因 GL4,该基因编码一个 MYB 家族 转录因子,基因编码区的一个单碱基突变导致了栽 培稻中编码蛋白的提前终止,穗部小花枝梗离层无 法形成,从而克服了落粒性的产生。这一研究结 果为深入认识非洲栽培稻的驯化过程提供了基础 数据。 在高粱中,Lin 等[69]构建了一个远缘杂交群 体,采用图位克隆技术手段,克隆了高粱落粒性控 制基因 Sh1,编码一个 YABBY 家族转录因子,在栽 培高粱中,共检测到了 3 种不同的功能弱化变异, 包括启动子区出现的碱基变异导致表达量的降低, 编码区 2.2 kb 片段的缺失导致产生截断的蛋白,以 及内含子区的一个“GT-to-GG”变异导致的可变剪 切。Sh1 单倍型分析结果提示高粱可能具有 3 次独 立的起源。深入的研究分析发现,水稻中的同源基 因 OsSh1 和玉米中的同源基因 ZmSh1-1 和 ZmSh1- 5.1+ZmSh1-5.2 具有相同的功能。这一研究结果支 持在高粱、水稻和玉米中存在落粒基因位点的平行 驯化选择的推论。 在大麦中,Pourkheirandish 等[72] 通过利用野生 大麦与栽培大麦的远缘杂交群体,采用图位克隆的 方法,克隆了大麦落粒基因 Btr1 和 Btr2。其中基因 Btr1 编码一个跨膜蛋白,Btr2 编码了一个具有 CAR 和 PIP 结构域的可溶性蛋白。研究发现在 Btr1 和 Btr2 中分别发生了 1 bp 和 11 bp 的碱基缺失,导致 翻译蛋白不完整,从而使栽培大麦获得了不落粒的 特性。形态解剖观察结果表明,大麦的落粒性是由 于小穗轴部细胞的细胞壁过薄导致穗轴过脆,从而 产生的落粒现象,与水稻中由于离层的产生导致的 落粒机制完全不同,这也从侧面揭示了在不同作物 中,相同性状的驯化机制可能是完全不同的。 2.2.2 株型穗型 在水稻中,Zhu 等[18]以特青为 受体亲本,利用野生稻染色体片段渗入系 YIL31 构 建的重组分离群体,采用图位克隆的技术手段,克 隆了控制水稻松散穗型基因 OsLG1,该基因编码 一个 SBP-domain 家族转录因子蛋白。研究发现, 在野生稻和栽培稻群体间,OsLG1 上游调控区存 在的一个单碱基替换导致了水稻穗型由野生稻的 松散型驯化为栽培水稻的紧凑型,揭示了人类对作 物驯化基因的选择完全可以发生在顺式调控元件 区域,并且这样的选择类型非常高效;Hua 等[17] 以 93-11 为受体亲本,创制鉴定野生稻染色体片段渗 入系 9YIL304,具有芒长增加的表型,图位克隆了控 制基因 LABA1,发现该基因编码一个细胞分裂素活 化酶,在栽培水稻中,由于该基因发生的一个移码突 变,导致细胞分裂素含量在芒生长原基中的含量减 低,从而使栽培水稻芒长变短。序列分析结果表明, LABA1 附近存在一个 800 kb 的核酸序列多样性选 择清除区域,单倍型溯源分析结果表明,LABA1 最 先在粳稻中被驯化选择,之后扩散渗入到籼稻中,提 示该基因在水稻驯化的早期受到了人工选择。 在玉米中,Studer 等[59]对玉米驯化基因 TB1 的遗传机制进行了深入的研究,通过远缘杂交手段, 获得了 18 个 TB1 基因组区段的玉米—大刍草基因 区段重组单株,并获得了这 18 个重组基因组区段的 近等基因系,通过遗传效应分析,结合多样性变异, 发现一个 Hopscotch 转座元件插入到了 TB1 基因的 上游,并且通过影响 TB1 的表达量控制分支分蘖性 的改变。单倍型分析结果证实了在栽培玉米中几 乎都含有这一 Hopscotch 转座元件,而野生种大刍 草中却几乎没有这一转座元件。分子时钟分析结 果表明,Hopscotch 转座元件的插入时间至少距今 1 万年,远在玉米驯化之前。研究结果证实了正是 由于人类对这一转座元件插入事件的选择,推动了 玉米的驯化进程,结果也再次验证了转座元件是物 种基因组进化的主要动力;Tian 等[58]采用图位克 隆技术,定位克隆了控制玉米叶片夹角的关键驯化 基因 UPA2,并证实了这一主效位点在玉米的驯化 过程中被选择丢失了,该位点变异发生在 ZmRAVL1 基因的上游调控区,是一个 2 bp 的碱基插入,可以 导致玉米叶夹角变小,并通过研究发现,该驯化基 因的育种应用可以显著提高玉米在密植条件下的 产量水平;Bommert 等[20]利用 TILLING 技术,验 证了玉米控制果穗行粒数的驯化基因 FASCIATED
1362 植物遗传资源学报 卷 EAR2(FEA2)的功能,研究发现FEA2编码一个组关联分析手段鉴定出了控制高粱茎秆持汁性的主 CLAVATA受体蛋白,在玉米的驯化过程中,通过增效基因位点,并通过图位克隆技术手段克隆了高粱 加小穗顶端分生组织的大小,可以增加果穗的穗行驯化相关基因Dny。研究发现Dny编码一个NAC1 数,从而推动玉米的驯化。该研究为认识玉米穗行转录因子家族蛋白,该基因控制细胞壁的合成过程 数的产生和驯化过程提供了宝贵的实验证据。 在栽培高粱中发生了功能缺失突变,由此导致了栽 在大麦中, Ramsay等(m采用全基因组关联分培高粱茎秆持汁性的提高。通过采用 XP-CLR算 析的方法,分析了大麦中控制侧翼小花育性的遗传法和核苷酸多样性分析发现,该基因在高粱驯化过 位点,克隆了控制基因Ⅰ NTERMEDIUM-C(INTC),程中受到了强烈选择。这一研究结果为认识高粱的 分析发现野生二棱大麦驯化成为六棱栽培大麦的驯化与起源提供了新的遗传数据。 过程中,该基因发挥了重要作用。研究同时发现,2.2.4籽粒与果实发育在大豆中,Sun等(21通过 ITC为玉米TB基因的同源基因,在控制穗部侧构建远缘杂交群体,图位克隆了控制大豆种皮可渗 翼小花的育性及分蘖性中具有关键性的调控功能。透性的驯化关键基因 Gmas-l,该基因编码一个钙 这一研究结果为深入认识作物的平行驯化选择过程依赖磷酸酶跨膜蛋白,在种皮中特异表达,并且与 提供了新的遗传学证据。 钙离子含量紧密相关。研究发现,栽培大豆中由于 223抽穗期与产量在水稻中,Dai等3以特青 Gmas-1发生了一个单碱基的突变,导致种皮渗透 为受体亲本,利用野生稻染色体片段渗入系YLL79,性增加。在大豆种质资源中进行性状分析发现,除 通过图位克隆技术克隆了控制水稻抽穗期的驯化了 Gmhs-.l突变之外,部分栽培大豆的种皮透水性 基因LHDl,研究发现该基因编码了已知抽穗期基提高还可通过增加种皮的破裂度实现。通过单倍型 因DTH8/Gh8的一个新的等位变异,编码一个具有分析证实, Gmas-在大豆中是单起源的,但由于 CCAAT-box结合特性的转录因子蛋白,亚细胞定位群体结构和基因流动性的影响,推测 Gmas-/可能 在细胞核,可以导致栽培水稻相比野生稻晚抽穗,进在大豆中经历了二次选择。这一研究为认识大豆的 步的研究发现,LHD可以在长日照条件下抑制驯化过程提供了实验依据;Wang等0采用全基因 Ehdl、Hd3a和RFT的表达,从而导致栽培水稻在组关联分析手段,克隆了大豆种皮持绿G基因,该 长日条件下抽穗期的延迟。 基因编码一个CAAX氨基酸残基蛋白酶。研究发 在玉米中, Sosso等[H通过分析玉米籽粒转录现该基因可以影响大豆种子休眠性,并且通过群体 组数据结合玉米全基因组驯化区段数据,得到了控遗传学 XP-CLR及核酸多样性分析发现,该基因在 制玉米籽粒灌浆的基因 UnSWEET4,该基因编码大豆的驯化过程中受到了选择。进一步在水稻及番 一个己醣跨膜转运蛋白,介导了营养物质从胚乳基茄的群体选择数据中,发现G基因的同源基因在驯 部转运层进入种子的过程。通过转座子插入突变体化过程中也受到了选择。通过功能分析发现,G基 筛选鉴定的方法,确定了该基因表达量的减低可以因及其在水稻和拟南芥中的同源基因具有相同的功 严重影响籽粒灌浆过程,进而影响籽粒的大小和粒能,G蛋白可以与NCED3和PSY互作,通过调控 重。研究同时发现,水稻中的同源基因 OSSWEE74ABA合成影响种子的休眠性。这一研究为认识种 突变后,也会出现灌浆减弱、籽粒变小变轻的表型。子休眠特性及其平行驯化过程提供了实验证据,提 研究结果表明,玉米和水稻的籽粒灌浆的驯化可能示在大豆、水稻、番茄和拟南芥中种子休眠特性存在 经历了平行选择 平行驯化的现象 在高粱中,Lu等m利用一个远缘杂交群体 在番茄中, Chakraban等l采用远缘杂交群体 通过QIL精细定位的方法,克隆了高粱抽穗期驯化克隆了控制果实大小的驯化相关基因32( SIKLUF), 基因HD,分析发现该基因具有锌指和CCT蛋白该基因编码一个细胞色素P450蛋白,该基因顺式 结构域,是 CONSTANS基因家族蛋白。在栽培高调控区一个单碱基的变异导致了该基因在栽培番茄 粱中,由于发生了5bp的碱基缺失,引起蛋白翻译中的表达量升高,并使番茄果实变大。研究同时发 发生移码,最终导致晚抽穗表型的出现。研究同时现,该基因在辣椒中的同源基因 CaKLUH与果实重 发现,该基因的同源基因在水稻及谷子中具有类似量调控密切相关,研究结果支持果实大小基因存在 的功能,揭示了农作物抽穗期驯化过程中可能普遍平行驯化选择的可能 具有的平行进化现象; Zhang等(2通过采用全基因 在黄瓜中, Shang等N采用驯化选择区段定位
1362 植 物 遗 传 资 源 学 报 20 卷 EAR2(FEA2)的功能,研究发现 FEA2 编码一个 CLAVATA 受体蛋白,在玉米的驯化过程中,通过增 加小穗顶端分生组织的大小,可以增加果穗的穗行 数,从而推动玉米的驯化。该研究为认识玉米穗行 数的产生和驯化过程提供了宝贵的实验证据。 在大麦中,Ramsay 等[71] 采用全基因组关联分 析的方法,分析了大麦中控制侧翼小花育性的遗传 位点,克隆了控制基因 INTERMEDIUM-C(INT-C), 分析发现野生二棱大麦驯化成为六棱栽培大麦的 过程中,该基因发挥了重要作用。研究同时发现, INT-C 为玉米 TB1 基因的同源基因,在控制穗部侧 翼小花的育性及分蘖性中具有关键性的调控功能。 这一研究结果为深入认识作物的平行驯化选择过程 提供了新的遗传学证据。 2.2.3 抽穗期与产量 在水稻中,Dai 等[50] 以特青 为受体亲本,利用野生稻染色体片段渗入系 YIL79, 通过图位克隆技术克隆了控制水稻抽穗期的驯化 基因 LHD1,研究发现该基因编码了已知抽穗期基 因 DTH8/Ghd8 的一个新的等位变异,编码一个具有 CCAAT-box 结合特性的转录因子蛋白,亚细胞定位 在细胞核,可以导致栽培水稻相比野生稻晚抽穗,进 一步的研究发现,LHD1 可以在长日照条件下抑制 Ehd1、Hd3a 和 RFT1 的表达,从而导致栽培水稻在 长日条件下抽穗期的延迟。 在玉米中,Sosso 等[14] 通过分析玉米籽粒转录 组数据结合玉米全基因组驯化区段数据,得到了控 制玉米籽粒灌浆的基因 ZmSWEET4c,该基因编码 一个己醣跨膜转运蛋白,介导了营养物质从胚乳基 部转运层进入种子的过程。通过转座子插入突变体 筛选鉴定的方法,确定了该基因表达量的减低可以 严重影响籽粒灌浆过程,进而影响籽粒的大小和粒 重。研究同时发现,水稻中的同源基因 OsSWEET4 突变后,也会出现灌浆减弱、籽粒变小变轻的表型。 研究结果表明,玉米和水稻的籽粒灌浆的驯化可能 经历了平行选择。 在高粱中,Liu 等[70]利用一个远缘杂交群体, 通过 QTL 精细定位的方法,克隆了高粱抽穗期驯化 基因 HD1,分析发现该基因具有锌指和 CCT 蛋白 结构域,是 CONSTANS 基因家族蛋白。在栽培高 粱中,由于发生了 5 bp 的碱基缺失,引起蛋白翻译 发生移码,最终导致晚抽穗表型的出现。研究同时 发现,该基因的同源基因在水稻及谷子中具有类似 的功能,揭示了农作物抽穗期驯化过程中可能普遍 具有的平行进化现象;Zhang 等[27] 通过采用全基因 组关联分析手段鉴定出了控制高粱茎秆持汁性的主 效基因位点,并通过图位克隆技术手段克隆了高粱 驯化相关基因 Dry。研究发现 Dry 编码一个 NAC1 转录因子家族蛋白,该基因控制细胞壁的合成过程, 在栽培高粱中发生了功能缺失突变,由此导致了栽 培高粱茎秆持汁性的提高。通过采用 XP-CLR 算 法和核苷酸多样性分析发现,该基因在高粱驯化过 程中受到了强烈选择。这一研究结果为认识高粱的 驯化与起源提供了新的遗传数据。 2.2.4 籽粒与果实发育 在大豆中,Sun 等[24] 通过 构建远缘杂交群体,图位克隆了控制大豆种皮可渗 透性的驯化关键基因 GmHs1-1,该基因编码一个钙 依赖磷酸酶跨膜蛋白,在种皮中特异表达,并且与 钙离子含量紧密相关。研究发现,栽培大豆中由于 GmHs1-1 发生了一个单碱基的突变,导致种皮渗透 性增加。在大豆种质资源中进行性状分析发现,除 了 GmHs1-1 突变之外,部分栽培大豆的种皮透水性 提高还可通过增加种皮的破裂度实现。通过单倍型 分析证实,GmHs1-1 在大豆中是单起源的,但由于 群体结构和基因流动性的影响,推测 GmHs1-1 可能 在大豆中经历了二次选择。这一研究为认识大豆的 驯化过程提供了实验依据;Wang 等[10] 采用全基因 组关联分析手段,克隆了大豆种皮持绿 G 基因,该 基因编码一个 CAAX 氨基酸残基蛋白酶。研究发 现该基因可以影响大豆种子休眠性,并且通过群体 遗传学 XP-CLR 及核酸多样性分析发现,该基因在 大豆的驯化过程中受到了选择。进一步在水稻及番 茄的群体选择数据中,发现 G 基因的同源基因在驯 化过程中也受到了选择。通过功能分析发现,G 基 因及其在水稻和拟南芥中的同源基因具有相同的功 能,G 蛋白可以与 NCED3 和 PSY 互作,通过调控 ABA 合成影响种子的休眠性。这一研究为认识种 子休眠特性及其平行驯化过程提供了实验证据,提 示在大豆、水稻、番茄和拟南芥中种子休眠特性存在 平行驯化的现象。 在番茄中,Chakrabarti 等[76] 采用远缘杂交群体, 克隆了控制果实大小的驯化相关基因 fw3.2(SlKLUH), 该基因编码一个细胞色素 P450 蛋白,该基因顺式 调控区一个单碱基的变异导致了该基因在栽培番茄 中的表达量升高,并使番茄果实变大。研究同时发 现,该基因在辣椒中的同源基因 CaKLUH 与果实重 量调控密切相关,研究结果支持果实大小基因存在 平行驯化选择的可能。 在黄瓜中,Shang 等[78] 采用驯化选择区段定位
贾冠清等:主要农作物驯化研究进展与展望 1363 分析的方法,鉴定出了黄瓜果实苦味控制基因Br,与野生大刍草间的基因交流规律进行了详细分析, 该基因的顺式调控区发生了多处变异,并在随后的结果发现栽培玉米和野生大刍草间存在广泛的相互 驯化过程中受到了选择。该基因表达量的降低引起基因渗透,来自野生大刍草的等位基因对栽培玉米 苦味物质积累的降低,从而使栽培黄瓜的食味品质适应髙海拔地区的生态环境作岀了重要贡献,而栽 得到了改善。 培玉米的等位基因对野生大刍草的生态适应性贡献 3作物驯化后的扩散 甚微。研究发现:(1)野生种与栽培种间的基因流 动是以不平衡不对称的形式不间断地持续发生的; 3.1作物驯化后的传播与多样性中心 (2)从野生种流向栽培种的基因流发生的更早,从 农作物的进化传播过程一般认为经历了4个主栽培种流向野生种的基因流发生的更晚;(3)野生 要阶段3:在第1阶段,作物完成驯化,主要表现为种等位基因渗入栽培玉米事件发生后,栽培玉米的 拥有驯化综合表征的栽培品种出现;第2阶段,最种植区域才开始出现扩散;(4)驯化相关基因组区 原始的驯化品种通过不断积累有益的等位变异,成段在野生种向栽培种的基因流动过程中受到了限 为更加适合栽培的品种;第3阶段,最适合栽培的制,但适应性相关基因组区段在这一过程中得到了 品种向其他地域扩散,不断地适应新的环境,积累更富集;(5)来自野生种的基因流在栽培玉米中产生 多新的等位变异,产生各类地方品种;第4阶段,在了广泛的影响,并已经得到了非意识性的育种应用。 不同生态区域,由于人为的育种活动,产生了大量这一研究首次在农作物中揭示了栽培种与野生种间 适应特定生态区域的优良栽培品种。这一过程中,的基因流动规律。在大豆中,Wang等利用大豆 由于起源中心变异时间最为悠久,往往积累了大量野生种与栽培种的重测序数据,系统研究了野生大 的遗传变异,从而形成了我们熟知的农作物多样性豆与栽培大豆间基因流的发生原因、主要类型和遗 中心( 传结果。分析发现了野生大豆与栽培大豆间不仅广 最新的研究发现,农作物驯化后的扩散过程与泛存在基因流动,而且在驯化选择相关基因组区段, 抽穗期的适应性紧密相关,如水稻中DTH70的自基因流动受到了排除性的抑制。在重组发生较少的 然变异决定了品种对多个纬度条件的适应性;玉米着丝粒区域,一些基因流动事件往往被保留了下来, 中调控 Omcc10基因的 CACTA-like转座子和调研究认为基因组的重组特性在清除基因流渗透痕迹 控ZmCC⑦基因的 Harbinger-like转座子先后出现的过程中可能发挥了重要的作用。研究同时发现, 在玉米起始驯化之后,并在玉米适应高纬度地区的大豆野生种和栽培种间天然发生的基因流动对于栽 过程中受到强烈选择;大豆中发现长童期J基因培大豆遗传多样性的产生和维持,以及大豆细胞核 自然变异是大豆适应低纬度环境种植的重要遗传基基因组与细胞质基因组不对称的进化起到了关键的 础821;谷子群体遗传学研究表明8,春谷与夏谷间推动作用。在谷子中,Ja等采用SSR分子标记 的遗传分化位点区域存在抽穗期相关基因。可以的方法,对谷子及其野生种青狗尾草间的基因流动 说,抽穗期相关基因的自然变异导致的环境适应性情况进行了扫描,结果证实在谷子和青狗尾草间存 在农作物扩散及形成次级多样性中心的过程中发挥在广泛的基因组交流,并且发现,青狗尾草内部的基 了重要的作用。这一系列研究为我们认识作物驯化因交流平均强度大于栽培谷子内部的基因交流强 后的扩散过程提供了新的思考依据。 度,青狗尾草与谷子间的基因交流强度最小。研究 3.2驯化作物与野生种间的基因交流 同时发现,尽管青狗尾草与谷子间的基因交流平均 农作物完成驯化后,不可避免的与野生近缘种强度小,但存在基因组位点被稳定渗入保留的现象 存在天然杂交现象,近年来,多个研究团队围绕驯这也在一定程度上证实了Sh等8报道的抗除草 化作物与野生种间的基因交流渗透规律开展了大量剂基因在谷子及青狗尾草间能够通过基因流动的形 研究工作,取得了部分研究进展:在水稻中, Huang式得以保留的推断。 等39在开展野生稻与栽培水稻大量测序研究的基 础上,发现部分基因组区段在野生稻和栽培稻间存4作物驯化理论与研究方法 在基因组相互嵌入,证实了栽培水稻在完成驯化后,4.1平行选择理论 仍然与野生稻存在基因组互渗现象。在玉米中,利 平行选择是指不同作物的同源基因在进化过程 用芯片杂交技术, Hufford等对墨西哥栽培玉米中同时受到选择的现象,其理论基础是主要农艺性
6 期 贾冠清等:主要农作物驯化研究进展与展望 1363 分析的方法,鉴定出了黄瓜果实苦味控制基因 Bt, 该基因的顺式调控区发生了多处变异,并在随后的 驯化过程中受到了选择。该基因表达量的降低引起 苦味物质积累的降低,从而使栽培黄瓜的食味品质 得到了改善。 3 作物驯化后的扩散 3.1 作物驯化后的传播与多样性中心 农作物的进化传播过程一般认为经历了 4 个主 要阶段[28] :在第 1 阶段,作物完成驯化,主要表现为 拥有驯化综合表征的栽培品种出现;第 2 阶段,最 原始的驯化品种通过不断积累有益的等位变异,成 为更加适合栽培的品种;第 3 阶段,最适合栽培的 品种向其他地域扩散,不断地适应新的环境,积累更 多新的等位变异,产生各类地方品种;第 4 阶段,在 不同生态区域,由于人为的育种活动,产生了大量 适应特定生态区域的优良栽培品种。这一过程中, 由于起源中心变异时间最为悠久,往往积累了大量 的遗传变异,从而形成了我们熟知的农作物多样性 中心[1] 。 最新的研究发现,农作物驯化后的扩散过程与 抽穗期的适应性紧密相关,如水稻中 DTH7[80] 的自 然变异决定了品种对多个纬度条件的适应性;玉米 中调控 ZmCCT10 基因的 CACTA-like 转座子和调 控 ZmCCT9 基因的 Harbinger-like 转座子先后出现 在玉米起始驯化之后,并在玉米适应高纬度地区的 过程中受到强烈选择[81] ;大豆中发现长童期 J 基因 自然变异是大豆适应低纬度环境种植的重要遗传基 础[82];谷子群体遗传学研究表明[83] ,春谷与夏谷间 的遗传分化位点区域存在抽穗期相关基因。可以 说,抽穗期相关基因的自然变异导致的环境适应性 在农作物扩散及形成次级多样性中心的过程中发挥 了重要的作用。这一系列研究为我们认识作物驯化 后的扩散过程提供了新的思考依据。 3.2 驯化作物与野生种间的基因交流 农作物完成驯化后,不可避免的与野生近缘种 存在天然杂交现象,近年来,多个研究团队围绕驯 化作物与野生种间的基因交流渗透规律开展了大量 研究工作,取得了部分研究进展:在水稻中,Huang 等[29] 在开展野生稻与栽培水稻大量测序研究的基 础上,发现部分基因组区段在野生稻和栽培稻间存 在基因组相互嵌入,证实了栽培水稻在完成驯化后, 仍然与野生稻存在基因组互渗现象。在玉米中,利 用芯片杂交技术,Hufford 等[84] 对墨西哥栽培玉米 与野生大刍草间的基因交流规律进行了详细分析, 结果发现栽培玉米和野生大刍草间存在广泛的相互 基因渗透,来自野生大刍草的等位基因对栽培玉米 适应高海拔地区的生态环境作出了重要贡献,而栽 培玉米的等位基因对野生大刍草的生态适应性贡献 甚微。研究发现:(1)野生种与栽培种间的基因流 动是以不平衡不对称的形式不间断地持续发生的; (2)从野生种流向栽培种的基因流发生的更早,从 栽培种流向野生种的基因流发生的更晚;(3)野生 种等位基因渗入栽培玉米事件发生后,栽培玉米的 种植区域才开始出现扩散;(4)驯化相关基因组区 段在野生种向栽培种的基因流动过程中受到了限 制,但适应性相关基因组区段在这一过程中得到了 富集;(5)来自野生种的基因流在栽培玉米中产生 了广泛的影响,并已经得到了非意识性的育种应用。 这一研究首次在农作物中揭示了栽培种与野生种间 的基因流动规律。在大豆中,Wang 等[85] 利用大豆 野生种与栽培种的重测序数据,系统研究了野生大 豆与栽培大豆间基因流的发生原因、主要类型和遗 传结果。分析发现了野生大豆与栽培大豆间不仅广 泛存在基因流动,而且在驯化选择相关基因组区段, 基因流动受到了排除性的抑制。在重组发生较少的 着丝粒区域,一些基因流动事件往往被保留了下来, 研究认为基因组的重组特性在清除基因流渗透痕迹 的过程中可能发挥了重要的作用。研究同时发现, 大豆野生种和栽培种间天然发生的基因流动对于栽 培大豆遗传多样性的产生和维持,以及大豆细胞核 基因组与细胞质基因组不对称的进化起到了关键的 推动作用。在谷子中,Jia 等[86] 采用 SSR 分子标记 的方法,对谷子及其野生种青狗尾草间的基因流动 情况进行了扫描,结果证实在谷子和青狗尾草间存 在广泛的基因组交流,并且发现,青狗尾草内部的基 因交流平均强度大于栽培谷子内部的基因交流强 度,青狗尾草与谷子间的基因交流强度最小。研究 同时发现,尽管青狗尾草与谷子间的基因交流平均 强度小,但存在基因组位点被稳定渗入保留的现象, 这也在一定程度上证实了 Shi 等[87] 报道的抗除草 剂基因在谷子及青狗尾草间能够通过基因流动的形 式得以保留的推断。 4 作物驯化理论与研究方法 4.1 平行选择理论 平行选择是指不同作物的同源基因在进化过程 中同时受到选择的现象,其理论基础是主要农艺性
1364 植物遗传资源学报 卷 状的趋同进化现象。近年来,这一理论得到了更多蔗为研究对象,通过转录组测序的手段,Amo等s 实验数据的支持,如:Lin等通过研究作物落粒对甘蔗的野生近缘种和栽培种的叶片及茎秆进行分 性,发现高粱的落粒性控制基因S(S加 attering)析,发现栽培甘蔗的基因多样性高于野生甘蔗,而且 与水稻中的同源基因 OsHi、以及玉米中的同源基没有检测到栽培种与野生种基因池间的遗传分化 因 ZmShl-l和ZmSh-5.1+ZmSh-5.2具有相同的功研究还同时发现栽培甘蔗具有和野生甘蔗近似的基 能,暗示了高粱、水稻和玉米中存在落粒基因位点因杂合度,而且进一步的研究表明,平衡选择的基因 的平行驯化选择;Wang等0克隆了大豆种皮持绿主要集中在蔗糖和淀粉代谢途径中;Wu等通过 G基因,可以影响大豆种子休眠性,该基因在大豆的重测序手段分析了梨的驯化过程,发现S-RNae在 驯化过程中受到了选择,通过功能分析发现,G基梨的驯化过程中经历了平衡选择,并强化了梨的自 因及其在水稻和拟南芥中的同源基因具有相同的功交不亲和特性。这些研究结果提示我们,平衡选择 能,G蛋白可以与NCED3和PSY互作,通过调控效应在作物的驯化过程中发挥着重要作用。 ABA合成影响种子的休眠性,研究结论支持大豆、4.3群体遗传统计规律 水稻、番茄和拟南芥中种子休眠特性存在平行驯化 农作物的驯化过程往往伴随着群体统计参量的 的现象;对主要作物Way糯性基因的功能的分析变化,如有效群体的减少,多样性的降低,新变异位 发现,在水稻、小麦、玉米、谷子、大麦、高粱和糜子等点的出现等。近年来,有多个研究揭示了这一规律 作物中9,糯性的产生都与Waxy基因的变异有 Huang等).用二代基因组重测序的手段,对446 关,证实了作物糯性基因的平行进化现象 份世界各地来源的野生稻(On= a rufipogon)进行 尽管平行选择理论得到了更多的实验验证,但了平均2倍覆盖的基因组测序研究,同时完成了对 仍有部分研究表明,平行选择理论无法解释所有的1083份栽培水稻平均1倍覆盖的基因组重测序,通 驯化现象,例如:Lai等通过系统分析高粱和玉过系统解析野生稻群体与栽培稻群体的全基因组核 米驯化过程中的关键驯化基因和位点,发现虽然主酸多样性的变异情况,发现野生稻的多样性(π)为 效的共线性驯化基因在不同作物中受到了重复选0.003,栽培稻多样性(π)为0.0024,下降了20% 择,但是更多的非共线基因依然解释了同样效应的 Hufford等30采用二代基因组重测序技术,完成了 性状变异;在谷子中对玉米驯化基因TB/的遗对35份玉米育成品种、23份玉米地方品种和17份 传效应分析表明:谷子的分支分蘖性的主效控制基玉米近缘野生种平均5倍覆盖的基因组测序研究, 因并不是TBl的同源基因,TB1对谷子分支分蘖性发现玉米野生种的多样性()为00059,栽培玉米 的遗传贡献非常微弱,同样的,在珍珠粟中1发现的多样性(T)为00048,下降了16%;黄瓜中的数 了TBl对分支分蘖性的微弱而非主效的控制效应;据∞表明,野生黄瓜在驯化为栽培黄瓜的过程中, Pourkheirandish等]克隆了大麦落粒基因Bn和多样性()由0.0048降为00015,下降了60%;番 Bm2,研究发现大麦的落粒性是由于小穗轴部细胞茄驯化过程0也表现类似的趋势,多样性()由 的细胞壁过薄导致穗轴过脆,从而产生的落粒现象,0.0032降为0.0012,下降了70% 与水稻、高粱中由于离层的产生导致的落粒机制完 此外,驯化的过程往往引起有害等位变异的 全不同。此外,对谷子落粒机制的研究也发现谷累积0,导致驯化作物适应性下降。如 Renaut 子小花基部的离层无法正常形成,这也从侧面揭示等在向日葵中发现栽培种与野生种相比,积 了在不同的作物中,相同性状的驯化机制可能是完累了更多的共有及特异的有害等位变异;在水稻 全不同的。 中的研究结果也表明驯化的籼稻和粳稻中都积 可以说,近年来,平行驯化与个性驯化理论都得累了更多的有害等位变异。这一现象的出现,有可 到了深入的发展,提示我们作物驯化整体上是一个能与驯化选择基因片段的搭车效应0有关,同时 平行选择和个性选择交织互动的过程,两者共同构由于天然重组几率的降低01和有效群体大小的缩 成了作物驯化的全貌。 减,势必会加快这一趋势。 4.2平衡选择理论 目前,基于对已有作物驯化过程的认识(23,从 平衡选择作为自然选择的一种形式,主要表现群体统计角度存在如下统计模型(图1):(1)野生 为基因位点呈现多态性,且一直保持平衡。在作物种中的部分个体由于一次驯化的作用,通过早期的 驯化研究中,近年来也发现了平衡选择的例子:以甘选择瓶颈,形成了最初的栽培品种,之后栽培品种经
1364 植 物 遗 传 资 源 学 报 20 卷 状的趋同进化现象。近年来,这一理论得到了更多 实验数据的支持,如:Lin 等[69]通过研究作物落粒 性,发现高粱的落粒性控制基因 Sh1(Shattering 1) 与水稻中的同源基因 OsSh1、以及玉米中的同源基 因 ZmSh1-1 和 ZmSh1-5.1+ZmSh1-5.2 具有相同的功 能,暗示了高粱、水稻和玉米中存在落粒基因位点 的平行驯化选择;Wang 等[10] 克隆了大豆种皮持绿 G 基因,可以影响大豆种子休眠性,该基因在大豆的 驯化过程中受到了选择,通过功能分析发现,G 基 因及其在水稻和拟南芥中的同源基因具有相同的功 能,G 蛋白可以与 NCED3 和 PSY 互作,通过调控 ABA 合成影响种子的休眠性,研究结论支持大豆、 水稻、番茄和拟南芥中种子休眠特性存在平行驯化 的现象;对主要作物 Waxy 糯性基因的功能的分析 发现,在水稻、小麦、玉米、谷子、大麦、高粱和糜子等 作物中[88-93] ,糯性的产生都与 Waxy 基因的变异有 关,证实了作物糯性基因的平行进化现象。 尽管平行选择理论得到了更多的实验验证,但 仍有部分研究表明,平行选择理论无法解释所有的 驯化现象,例如:Lai 等[94]通过系统分析高粱和玉 米驯化过程中的关键驯化基因和位点,发现虽然主 效的共线性驯化基因在不同作物中受到了重复选 择,但是更多的非共线基因依然解释了同样效应的 性状变异;在谷子中[95]对玉米驯化基因 TB1 的遗 传效应分析表明:谷子的分支分蘖性的主效控制基 因并不是 TB1 的同源基因,TB1 对谷子分支分蘖性 的遗传贡献非常微弱,同样的,在珍珠粟中[96] 发现 了 TB1 对分支分蘖性的微弱而非主效的控制效应; Pourkheirandish 等[72]克隆了大麦落粒基因 Btr1 和 Btr2,研究发现大麦的落粒性是由于小穗轴部细胞 的细胞壁过薄导致穗轴过脆,从而产生的落粒现象, 与水稻、高粱中由于离层的产生导致的落粒机制完 全不同。此外,对谷子落粒机制的研究[97] 也发现谷 子小花基部的离层无法正常形成,这也从侧面揭示 了在不同的作物中,相同性状的驯化机制可能是完 全不同的。 可以说,近年来,平行驯化与个性驯化理论都得 到了深入的发展,提示我们作物驯化整体上是一个 平行选择和个性选择交织互动的过程,两者共同构 成了作物驯化的全貌。 4.2 平衡选择理论 平衡选择作为自然选择的一种形式,主要表现 为基因位点呈现多态性,且一直保持平衡。在作物 驯化研究中,近年来也发现了平衡选择的例子:以甘 蔗为研究对象,通过转录组测序的手段,Arro 等[98] 对甘蔗的野生近缘种和栽培种的叶片及茎秆进行分 析,发现栽培甘蔗的基因多样性高于野生甘蔗,而且 没有检测到栽培种与野生种基因池间的遗传分化, 研究还同时发现栽培甘蔗具有和野生甘蔗近似的基 因杂合度,而且进一步的研究表明,平衡选择的基因 主要集中在蔗糖和淀粉代谢途径中;Wu 等[39] 通过 重测序手段分析了梨的驯化过程,发现 S-RNase 在 梨的驯化过程中经历了平衡选择,并强化了梨的自 交不亲和特性。这些研究结果提示我们,平衡选择 效应在作物的驯化过程中发挥着重要作用。 4.3 群体遗传统计规律 农作物的驯化过程往往伴随着群体统计参量的 变化,如有效群体的减少,多样性的降低,新变异位 点的出现等。近年来,有多个研究揭示了这一规律: Huang 等[29] 采用二代基因组重测序的手段,对 446 份世界各地来源的野生稻(Oryza rufipogon)进行 了平均 2 倍覆盖的基因组测序研究,同时完成了对 1083 份栽培水稻平均 1 倍覆盖的基因组重测序,通 过系统解析野生稻群体与栽培稻群体的全基因组核 酸多样性的变异情况,发现野生稻的多样性(π)为 0.003,栽培稻多样性(π)为 0.0024,下降了 20%; Hufford 等[30] 采用二代基因组重测序技术,完成了 对 35 份玉米育成品种、23 份玉米地方品种和 17 份 玉米近缘野生种平均 5 倍覆盖的基因组测序研究, 发现玉米野生种的多样性(π)为 0.0059,栽培玉米 的多样性(π)为 0.0048,下降了 16%;黄瓜中的数 据[99] 表明,野生黄瓜在驯化为栽培黄瓜的过程中, 多样性(π)由 0.0048 降为 0.0015,下降了 60%;番 茄驯化过程[100] 也表现类似的趋势,多样性(π)由 0.0032 降为 0.0012,下降了 70%。 此外,驯化的过程往往引起有害等位变异的 累积[101] ,导致驯化作物适应性下降。如 Renaut 等[102]在向日葵中发现栽培种与野生种相比,积 累了更多的共有及特异的有害等位变异;在水稻 中[103] 的研究结果也表明驯化的籼稻和粳稻中都积 累了更多的有害等位变异。这一现象的出现,有可 能与驯化选择基因片段的搭车效应[104] 有关,同时 由于天然重组几率的降低[105] 和有效群体大小的缩 减,势必会加快这一趋势。 目前,基于对已有作物驯化过程的认识[28] ,从 群体统计角度存在如下统计模型(图 1):(1)野生 种中的部分个体由于一次驯化的作用,通过早期的 选择瓶颈,形成了最初的栽培品种,之后栽培品种经