Journal of 生物数学学报2000,15(3):358-366 Biomathematics 利用回交B1和B2及F2群体鉴定数量性状两对 主基因+多基因混合遗传模型 章元明'盖钧镒王建康 (1南京农业大学大豆研究所,农业部国家大豆改良中心,江苏南京210095, 2河南省农科院实骏中心,河南郑州450002) 摘要:QTL作国和主基因十多基因混合遗传分新表明:拓展两对主基固+多基因混合遗 传模型十分必要,本文利用混合分有理论、AIC准则在回交B和B2群体F2年体中鉴定 两对主基国的存在,当主基图存在时估计其速传参数:网时还改进了利用亲本、F1和国变B1 和B2年体,或亲本、F]和F2群体鉴完多基因存在的方法.分布李数的估计采用IECM算 法,以水稻棘高性状为制说明诘方法的应用 关键词:数量性状:主基因+多茶图混合遣传:况合型:ECM界法:水粉株高 中图分类号Q348 文献标识码:A 文童绵号:1001-9626(20001030358-09 最早认为数量性状是由效应相等的微效多基因控制。 QTL作图结果表明其效应大小有 别,也发现了如水稻矮秆等数量性状还受主基因的控制.由此盖钧镒等(1999)将主基因+多 基因(简称主+多基因)混合遗传作为数量性状的通用性模型,单纯主基因和单纯多基因作为 其特例四,在Elston等(1971,1973)工作的基础上提出了适合植物的主+多基因混合遗传分 析的试验设计和统计分析方法2司 ,现已有初步应用成果,例如提出水稻广亲和性、白叶枯病 抗性和玉米矮花叶病抗性的遗传模式,以及大豆抗食叶性害虫和孢囊线虫病的育种策路.随着 应用的深入,该方法还将从以下三方面进行扩展:①扩展不同类型的分离世代,包括重组近交 家系群体;②扩展至有重复的家系世代,包括多个家系世代的联合,③将遗传模型扩展至2对 主+多基因.因此,本文利用混合分布理论、AIC准则和IECM算法在回交或F2世代中扩展 数量性状2对主基因+多基因混合遗传模型,还改进了鉴定多基因存在的方法2,,主+多基 因混合遗传模型的数学模型和符号与文献2,4相同,其基本假定参见文献⑧,这里从路。 1回交B1和B2及F2群体的遗传组成 当存在两对主基因时,假定亲本主基因型分别为AABB(P)和aab(P2),B1=F1×P1,B2= 收稿日期:1999-04-12 基金项目:国家自然科学基金项目,国家973项目和重庆市科委应用基础研究项目资助 作者简介:章元明(1965-),男,重庆永川人,南京农业大学大豆研究所农业部闲大豆改良中心教授。两士 1994-2009 China Academie Joumal Eleetronie Publishing House.All rights reserved hutp://www.enkinet
⑧ 生 物 数 学 学 报 , 一 利 用回 交 和 及 群体鉴定数量性状两对 主基因 多基因混合遗传模型 章元明 ‘ 盖钧锰 ‘ 王建康 ’ 南京农业大学大豆研究所 , 农业部国家大豆改 良中心 , 江苏 南京 河南省农科院实验中心 , 河南 郑州 摘 要 作 图和 主 基 因 多基 因混 合遗传分 析表 明 拓展 两对 主 基 因 多基 因混 合遗 传模型 十 分必 要 本文 利 用混 合分 布理论 、 准 则 在 回 交 和 群体或 群体 中鉴定 两对 主 基 因 的存在 , 当主 基 因存在时估计 其遗传参数 同时还 改进 了利 用 亲本 、 和 回 交 和 群体 , 或 亲本 、 和 群 体鉴 定 多基 因存在的方 法 分布 参数 的估计 采用 葬 法 以水稻株 高性状 为例说明该 方 法 的 应 用 关键词 数 量性 状 主 基 因 多基 因混 合遗传 混 合模 型 算法 水稻 株 高 中图分类号 文献标识码 文章编号 一 一 一 最早认为数量性状是 由效应相等的微效多基 因控制 作 图结果表 明其效应大小有 别 , 也发现 了如水稻矮秆等数量性状还受主基因的控制 由此盖钧槛等 将主基 因 多 基 因 简称主 多基因 混合遗传作为数量性状的通用性模型 , 单纯主基 因和单纯多基 因作为 其特例 【’ , 在 等 , 工作的基础上提 出了适合植物 的主 多基因混合遗传分 析的试验设计和统计分析方法 〔一 】 , 现 已有初步应用成果 , 例如提 出水稻广亲和性 、 白叶枯病 抗性和 玉米矮花 叶病抗性的遗传模式 , 以及大豆抗食叶性害虫和抱囊线虫病的育种策略 随着 应用的深入 , 该方法还将从以下三方面进行扩展 ①扩展不 同类型 的分离世代 , 包括重组近交 家系群体 ②扩展至 有重复的家系世代 , 包括多个家系世代的联合 ①将遗传模型扩展至 对 主 十 多基因 因此 , 本文利用混合分布理论 、 准则和 算法在 回交或 世代中扩展 数量性状 对主基因 多基因混合遗传模型 , 还改进 了鉴定多基因存在的方法 比 〕主 多基 因混合遗传模型的数学模型和符号与文献 【 , 相 同 , 其基本假定参见文献 , 这里从略 回 交 和 及 群体的遗传组成 当存在两对主基因时 , 假定亲本主基因型分别为 和 。 。品 , 又 , , , 收稿 期 荃金项 目 作者简介 一 一 国家 自然科学基金项 目 国家 项 目和重庆市科委应用基础研究项 目资助 章元明 一 , 男 , 重庆永川人 , 南京农业大学大豆研究所农业部国家大豆改良中心副教授 硕士 ·
第3期 章元明等,利用回交B1和B2及F2群体鉴定数量性状两对主基因十多基因混合遗传模型359 F1×P2B1群体为AABB,AABb,AaBB和AaB64种主基因型等比例混合,分别用N(u41,) N(4,)表示这4种基因型个体观测值的分布;B2群体为AaBb,Aab,aaB和ab4种主 基因型等比例混合,分别用N(451,)~N(54:)表示这4种基因型个体观测值的分布;F2 群体为AABB,AAB6,AAbb,AaBB,AaB6,Aabb,aaBB,aaB6和aabb9种主基因型按孟德尔分 离比的混合,分别用N(u61,)~V(469,)表示这9种基因型个体观测值的分布.在两个主基 因服从等加性、完全显性和等显性下,B1,B2和F2的成分分布数分别为:3(1:2:1),3(1:2:1) 和51:4:6:4:1:1,41:1:1:1)和4(9:3:3:1:1、31:2:1)和3(9:6:1).若主基因符合 加性-显性-上位性模型,B1、B2和F2群体的主基因遗传方差分别为 a品gB5(d。-ha)2+(d-ho)2+(d-ha+ia6-jba-)+(d-hs)i-ja6+ja-月 +6Ii-1a2+-ja)2+-)2+(ab-ba)2+0ab-)2+0e-021,(1a) (B)=d+ha)?+(ds+h)2+(d.+ha)(i+jj+)+(ds+hs)(i-++ +6I+a)2+(+jba)2+-2+(iab-jba2+ab+02+(e+02], (1b) 2网-e++++P+6++(+)+(+司)到 (1c) 其中,da和d为主基因基因型AA和BB的加性效应,ha和hb为主基因基因型Aa和B6 传方差σ品,与相应群体的表型方差序之比。F2群体成分分布平均数与遗传参数间的关系 分别为间 461=n6+C, 462=m6+C2, 463=m6+Cs H64=m6+C4 “5=m6+C, 66=m6+C6 467=m6+C7,68=m6+C8, 469=m6+Cg 其中C~Cg分别是da+d+i,da+h+jab,da-d-i,ha+d+jba,ha+h+l,ha-d-jba,-da+d i,-d。+hb-ja6和-da-d6+i.显然1~444分别为m4+C,m4+C2,m4+C4,m4+C5451~54 分别为m5+C5,ms+C6,ms+Ca,ms+C,其中m4,m5和m6分别为双亲平均数m与各世 代多基因效应之和,此外,B1,B2和F2群体成分分布方差(子,号和)分别削分为多基因方 差(c0,和c0)与环境方差σ2两组分之和,即σ子=0十2(6=4,5,6) 2利用回交B1和B2群体及F2群体鉴定两对主基因的存在 21遗传模型的建立 根据1建立利用回交B1和B2或F2群体鉴定两对主基因的遗传模型见表1,无主基因 的A-0模型以及一对主基因的加性-显性、加性、完全显性和负向完全显性的A-1~A-4 模型参见文献[1,4.若两对主基因符合加性-显性-上位性模型,利用B,和B2群体鉴定两 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
第 期 章元明等 利用回交 和 及 群体鉴定数量性状两对主基因 多基因混合遗传模型 群体为 , , 。 和 。 种主基因型等比例混合 , 分别用 尸 , , 。牙一 州内 , 心 表示这 种基 因型个体观测值的分布 群体为 石 , 。品 , 。。 和 。 。赫 种主 基因型等 比例混 合 , 分别用 户 , 峭 一 户 , 峭 表示这 种基因型个体观测值的分布 群体为 八且刀 刀 , 八刀 , 八入 。入。 刀刀 , 八。刀 , 八。乙 , 。 刀 刀 , 刀 和 种主基因型按孟德尔分 离比的混合 , 分别用 尸 , 嵘 一 户 , 端 表示这 种基因型个体观测值的分布 在两个主基 因服从等加性 、 完全显性和等显性下 , 。 和 的成分分布数分别为 , 和 , 和 、 和 若主基因符合 加性 一 显性 一 上位性模型 , 、 和 群体的主基因遗传方差分别为 『 。 , 。 〔“ 。 一 “ 。 己 一 ” “ 。 一 ” 。 、 。 乙 一 、乙。 一 ‘ “ 一 、‘ 一 , 。 、 。 一 , 击 〔、一 , 一 卜 。 ‘一 ‘ 一 , · 、一 ‘ ’ , 乙一 ‘ ’ , 。 · , 一 。“ 。 ” 。 “乙 “ “ 。 ” 。 一 ,一 、‘。 ‘ “ 、 一 一 ,一 , 。 , 了飞产泞、了 ︸咭 产、了、、份 、 六【 。 乞 。。 ’ 乞一 。 一 。。 , 。 “ 。。 “ 〕 , · 。 一 己 一 一 己 一 · 乙 · 、 · · 、二 ’ · 人乙 · ’ · 誓 其中 , 。 和 。 为主基因基因型 和 的加性效应 , 。 和 。 为主基因基因型 和 乙 的显性效应 , £ , 。, 九 。 和 分别为主基因加性 助 加性 、 加性 助 显性 的 、 显性 。卜 加性 列 和 显性 。 显性 句 的互作效应 · 主基因遗传率 轰 。 为主基因遗 传方差 二轰 。 与相应群体的表型方差 峪 之 比 · 群体成分分布平均数与遗传参数间的关系 分别为 娜 , 脚 二 , 娜 十 姚 , 内 性 , 娜 二 吼 , 内 十 氏 , 户 , 户 。 , 尸 。, 其中 、 分别是 。 。 , 。 。 九。, 。 一 。一 乞 , 。 。 九 。 , 。 。 , 。 一 。一 办 。 , 一 。 十 。一 , 一 。 。一 。和 一 。 一 。 显然 拼 、 内 分别为 , 。 , 。 伪 , 尸 冉 分别为 。 , , 。 。 。 。 , 其中 ’ 。 。 和 分别为双亲平均数 与各世 代多基因效应之和 此外 , , 和 群体成分分布方差 哎 , 峭和峭 分别剖分为多基 因方 差 吠 。, 『孔和峭 。 与环境方差 榨 两组分之和 , 即 叮 叮 。 , 营 , , 盯 利用回 交 , 和 群体及 群体鉴定两对主基因的存在 遗传模型的建立 根据 互 建立利用 回交 和 或 群体鉴定两对主基 因的遗传模型见表 的 一 模型 以及一对主基因的加性 一 显性 、 模型参见文献 【 , 若两对主基因符合加性 加性 、 完全显性和 负向完全显性的 , 无主基因 一 一 一 显性 一 上位性模型 , 利用 和 群体鉴定两
生物数学学报 第15卷 对主基因存在的样本似然函数中的一阶分布参数个数少于相应一阶遗传参数个数,无法估计一 阶遗传参数,因此这种情况在这里未加以讨论,只能在多世代的联合分析中考虑 2.2利用回交或F?群体鉴定两对主基因的似然函数和分布参数的极大似然估计 利用回交B1和B2或F2群体可将主基因的效应分解出来.记x4,6:和工6i,以及n4,ng 和n6分别为B1,B2和F2群体的观测值和样本容量.由51的假定,B1群体为k:个N(u,) 的混合;B2群体为k2个V(,)的混合,F2群体为3个N(6,)的混合.利用B和 B,群体群体鉴定主基因存在的样本似然函数为 L1(Y间)=ΠT4f(z4i,Π∑srf(xa:4s,©) (2) =1=1 其中.八x6:6:)是N(“,)的密度函数.利用F2群体的样本似然函数参见文献[4 表1两对主基因遗传横型下B!和B2成F2群体所包含的成分分布数及相应的漆传参数 able 1 The Number of Component Distributions and Corresponding Genetic Parameters of B and Ba or F2 under Two Major Genes Inheritance Models 成分分 独立参 一阶 二阶分 约東条 体 型 布个数 数个数 传参数 布参数 件个数 B-1 12 mmda,do.ha,hi,jab.jta. B=2 8 8 ma,ms.de.dh.ha.hh 04.o1 B. B-3 de.do(ha =h =0) g B-4 6 m4,m5,d=da▣,ha=hb=0) 01.02 B2 B-5 5 6 ms.ms,dal=ha),dol=h) a2.2 B-6 4 (=da do=ho=ho) 1 B-1 9 10 m6,da,da.has ha.i,jab.joa.! 02 B-2 9 me,da,dn,ha,h 呢 4 B-3 9 me,da,da(ha =hh=0) 6 B-4 5 3 m6,d=d。=d.h。=hb=0】 a2 B-5 4 me,da(=ha).du(=hp) B-6 3 3 m6.d(=de do=ha =hs) g2 1 采用IECM算法口刮获得分布参数的极大似然估计值. ECM算法按下列两步骤进行 对F2群体,E步骤:求在给定Y,下Ym,条件分布的完全资料对数似然函数的条件期望值 Q(010()), Q()=E(Lc(Y))=w (3) =1j=1 其中,Lc(Yi)是对数似然函数,u6:是r6归属第i种主基因型的后验概率.迭代CM步骤: 分步骤极大化Q(0),并用极大值点处的6值代替:-)作为下一轮循环的初值.Q(©9 Chn demie oumErn PbisinHousei reservedp:
生 物 数 学 学 报 第 卷 对主基因存在的样本似然函数中的一 阶分布参数个数少于相应一阶遗传参数个数 , 无法估计一 阶遗传参数 , 因此这种情况在这里未加 以讨论 , 只能在多世代的联合分析 中考虑 利 用回交或 群体鉴定两对主基因的似然函数和分布参数的极大似然估计 利用 回交 和 或 群体可将主基因的效应分解出来 记 八 、, 几‘ 和 、 , 以及 。 , 和 分别为 , 和 群体的观测值和样本容量 由 盯 的假定 , 群体为 个 户 , 二矛 的混合 群体为 无 个 冉 , , 嵘 的混合 群体为 个 内 , , 峭 的混合 利用 和 群体群体鉴定主基 因存在的样本似然函数为 唯 无 八 人 一 艺 二 ‘ , 、 。 , 二履 艺 二 。 , 二 , 云 其中 , 娜 , 峭 是 娜 。, 峭 的密度函数 利用 群体的样本似然函数参见文献 农 两对主荟因遗传棋型下 和 或 群体所包含的成分分布数及相应的遗传参数 成分分 布个数 独立参 数个数 一阶遗 传参数 二阶分 布参数 。牙 , 。置 。军 , 。置 。军 , 。里 约束条 件个数 群体 型模 一 一 一 一 及 一 一 一 咭 , , , ‘ , , 七, 乞 , 了 , , 乙 , , , , 九 , , 惋 , , , 。 。 。 , 爪 , 。, 。 。 二 , , 。 , 。 。 爪 , , 创 。 二 心 。 坑 峭峭咭峭 一 一 孟 一 一 一 一 爪 , , 。, , ‘ , , 夕。‘ , 。 , 爪 , , 心 , 人 , 坑 , , 。 。 。 , 。 。, 。 。 二 , 。 二 。 , 。 。 二 , 创 。 九 。 惋 采用 算法 “ 】获得分布参数的极大似然估计值 算法按下列两步骤进行 对 群体 , 步骤 求在给定 , 下 珠 。 条件分布的完全资料对数似然函数的条件期望值 夕‘ , 人 几 ‘ ‘ 百 五 , 夕 。 艺艺 二 ‘ 二 ‘ “ ‘, 口 言 落 其中 , 内是对数似然函数 , 二 , , 是 归属第 种主基因型的后验概率 迭代 步骤 分步骤极大化 引 ‘ , 并用极大值点处 的 。值代替 亡一 ‘ 作为下一轮循环的初值 引
第3期 章元明等:利用回交B1和B2及F2群体鉴定数量生状两对主因十多蓄因混合遗传模361 的极大值点由下列公式确定 n 2=1,…,k3, (4a) Le(Y10)-mgm1/=0. (46) m=l 其中,9m是分布平均数间的第m个约束条件,m是Lagrange常数,k是约束条件个数 首先,固定多基因方差组分和环境方差组分,求分布平均数的条件极大似然估计:①由约 束条件方程和平均数法代公式得到的联立方程组求入:②由分布平均数迭代公式得到其极大 条件似然估计值;然后,固定已得到的分布平均数,求多基因方差组分与环境方差组分 之和的条件极大似然估计 o+a=on(Hai)"/no (5) 对似然函数(②)中分布参数的估计,可仿此进行 2.3遗传模型的AIC判定和适合性检验 采用文献8的方法,通过比较0、1和2对主基因的A-0,A-1~A-4,B-1~ B一6共11个遗传模型的AC值以选择最优遗传模型,并且进行遗传模型的均匀性检验 (U?,U?和U学统计量)、Smirnov检验(nW2统计量)和Kolmogorov检验(Dn统计量)以检 验其适合性,其基本公式参见文献8).在选择遗传模型时,要综合考虑极大对数似然值、AIC 值和适合性检验结果 2.4遗传参数的估计 确定了数量性状最适遗传模型后便由分布参数的估计值估计相应遗传参数.1已经给 出了F2群体各成分分布平均数与一阶遗传参数的相互关系,由此获得分布平均数向量(= (u uek,2)与一阶读传参数向量G(=(m6,d。,d.ha,hb.i,iab,ba,1)7)的关系:0=AG 其中,A是系数矩阵由小二来法原理可得到一阶透传参数的最小二采估计 G=(ATA)-1AT司 同理,容易获得B和B,群体各成分分布平均数与一阶遗传参数间的关系,用最小二乘法估 计一阶遗传参数.若主基因符合加性-显性模型,利用B!和B2得到的一阶遗传参数为 m4=(41+42+443十4-2451+2454), m5=42w41-24+51+452+453+4s, d=4441+42-“43-44+u51+452-453-454) C1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
第 期 章元明等 利用 回交 和 及 群体鉴定数量性状两对主基因 多基因混合遗传模型 的极大值点由下列公式确定 、 、 少、 ‘ 任月月 了‘ 二 ‘口、、、 , 二 堂零 二 , … , 肠 , 口‘ 一 艺 ‘ 口 , 其中 , 。 是分布平均数间的第 个约束条件 , 入二 是 常数 , 是约束条件个数 首先 , 固定多基因方差组分和环境方差组分 , 求分布平均数的条件极大似然估计 ①由约 束条件方程和 平均数迭代公式得到 的联立方程组求 入。 ②由分布平均数迭代公式得到其极大 条件似然估计值 然后 , 固定已得到 的分布平均数 , 求多基因方差组分 嵘 。 与环境方差组分 心 之和 的条件极大似然估计 人 几 二言 。 二彗 艺艺 二 、 , 一 。 ‘ , 葱 对似然函数 中分布参数的估计 , 可仿此进行 遗传模型的 判定和适合性检验 采用文献 的方法 , 通过 比较 。 、 和 对主基因的 一 。 , 一 一 一 , 一 、 一 共 个遗传模型 的 值以选择最优遗传模型 , 并且进行遗传模型的均匀性检验 子 , 和蜡统计量 、 检验 统计量 和 检验 。 统计量 以检 验其适合性 , 其基本公式参见文献 在选择遗传模型时 , 要综合考虑极大对数似然值 、 值和适合性检验结果 遗传参数的估计 确定了数量性状最适遗传模型后便 由分布参数的估计值估计相应遗传参数 互 已经给 出了 群体各成分分 布平均数与一 阶遗传参数 的相互关系 , 由此获得分布平均数 向量 娜 , … , 娜 、 勺 与一阶遗传参数向量 。 , 。 , 。, 。 , 。, ‘ , 。, 九 。 , 勺 的关系 夕 , 其中 , 是 系数矩 阵 由最小二乘法原理可得到 一阶遗传参数的最小二乘估计 亡二 助 一 ‘ 肠 同理 , 容易获得 和 群体各成分分布平均数与一 阶遗传参数间的关系 , 用最小二乘法估 计一阶遗传参数 若主基因符合加性 一 显性模型 , 利用 和 得到 的一 阶遗传参数为 市 。 。 。 。 一 , 、 一 一 。 。 。 。 , “ 。 一 。 。 一 。 一 。 十 。 。 一 。 一 。
6 生物数学学报 第15举 d=41-h42+43-44+451-52+53-45, h2=4(-41-42+3+h+451+452-53-4s4) h=4-41+42-4g++1-452+53-45 同理可获得其它模型参数的极大似然估计.关于二阶遗传参数的估计结合1和2.1有关内容 获得.关于分离世代个体的主基因型归类可参考文献2,4,8刚 3多基因存在的鉴定 从1可知,,号和可剖分为多基因方差组分和环境方差组分两部分.在只有B, 和B2群体或只有F2群体的情况下,不能将多基因方差组分和环境方差组分分开.因此,在 多基因鉴定时,尚需利用亲本和下1群体以获得环境方差的估计,从而鉴定多基因的存在 记x1,22:和3,以及n1,n2和n3分别为P1,F1,P2群体观测值和样本容量.由假定可知: 工~N(4,)(行=1,2,3).因此,由B:和B2(或F2)群体鉴定多基因存在的样本似然函数分 别为2,4 e)(). 1 (6a) La()=II()If()IIf) i∑maf(iHa,) (6b) 通过构造H0:不存在多基因(=和=或=,多基因效应的平均数为0): H。:存在多基因(σ>0和>0或σ>0,多基因效应的平均数不为0).计算两种假设 下的最大似然函数值Lo和L。,构造出似然比统计量入=2血L。-nLo)~x以鉴定多基因 是否存在,其中,山为两种假设下相差的遗传叁数个数.采用IECM算法获得分布参数的极 大似然估计值,E步骤和迭代CM步骤的CM1与S2.2相似,下面给出利用P1,F1,P2和F2 鉴定多基因存在的迭代CM2和迭代CM步骤.迭代CM2是固定分布平均数与误差方差条件 下用选代公式求多基因方差组分,选代CM:是固定分布平均数和多基因方差组分条件下用选 代公式求误差方差.。和?的选代公式如下 3 ne (8) =1j=1 11 =1=1 19-09 China Academie JouaEleetronic Pablishing House.All rights reserved.hutp:/www.enki.net
生 物 数 学 学 报 第 卷 砚一 。 一 。 。 一 。 。 一 。 。 一 。 , 一 壹 一 。 一 。 。 。 。 。 一 。 一 。 , · 一 。 十 。 一 。 。 。 一 。 。 一 。 八 同理可获得其它模型参数的极大似然估计 关于二 阶遗传参数的估计结合 互 和 互 有关内容 获得 关于分离世代个体的主基因型归类可参考文献 , , 多基因存在的鉴定 从 盯 可知 , 叹 , 峭 和 峭 可剖分为多基 因方差组分和 环境方差组分两部分 在只有 和 群体或只有 群体的情况下 , 不能将多基因方差组分和环境方差组分分开 因此 , 在 多基 因鉴定时 , 尚需 利用 亲本和 群体以 获得 环 境方差 的估计 , 从而 鉴定多基因的存在 记 、, ‘ 和 、 , 以及 , 和 分别为 , , 群体观测值和样本容量 由假定可知 勺 一 州户 , 嵘 , , , 因此 , 由 和 或 群体鉴定多基因存在 的样本似然函数分 别为 【 , 〕 了 ‘ 。, , 。置 了 、 。 , 。了 了 ‘ 。 , , 署 感 一 天 几 无 艺 二 。 , ‘ 。 。, 孑 艺 二 、 。 亡, 叮爹 , 茗 茗 几 , ,‘ 。 , 。营 了 、 。 , , 置 。 , , 奢 ‘ 葱 百 性 人 艺 二 亡 ‘ 。 。, 口言 百 通过构造 。 不存在多基因 峭 心 和 峭 嵘 或 峭 二 心 , 多基因效应的平均数为 。 存在多基因 二军 。 和 二 。 或 嵘 。 , 多基因效应的平均数不为 计算两种假设 下的最大似然函数值 和 。 , 构造 出似然 比统计量 入 。 一 一 二 夯以鉴定多基因 是否存在 , 其中 , 为两种假设下相差 的遗传参数个数 采用 算法获得分布参数的极 大似然估计值 , 步骤和迭代 步骤 的 与 壮 相似 , 下面给出利用 , , 和 鉴定多基因存在的迭代 和迭代 屿 步骤 迭代 是固定分布平均数与误差方差条件 下用迭代公式求多基因方差组分 , 迭代 屿 是固定分布平均数和多基因方差组分条件下用迭 代公式求误差方差 峭 。 和 心 的迭代公式如下 二 , 、 , 一 尸 ‘ 。 一 , 了 艺、 , 概艺阁一 ‘, 口 , 人 介 心 艺公 夕 艺闪 一 。、 ’ 艺 ”矛艺 切 , 、 一 。 ‘ ’ 艺 ‘ 艺 。‘ 艺 二 , ‘ , 玄 夕 二 了
第3期 章元明等:利用回交B:和B2及P?群体鉴定数量性状两对主基因十多基因混合遗传模型363 其中,=/(o+)利用B,和B2群体鉴定多基因存在的算法可仿此进行 本文作者应用Turbo C+语言编制了以上全套IECM算法的软件F2.EXE和F2P.EXE(利 用F,群体鉴定主基因和利用亲本、F,与F,鉴定多基因的存在)、B.EXE(利用B,和B2群 体鉴定主基因的存在)和BP,EXE(利用亲本、F:、B,和B2群体鉴定多基因的存在),由此 计算复杂的工作变得十分简单,读者如有需要可与作者联系. 4应用举例 根据水稻南京6号×广丛杂交组合B1,B2群体1,周鉴定主基因存在的结果见表2.由表2 可知,A-1和B-2棋型的AIC值相对较小,A一1模型为最优遗传模型,B-2模型为次优 模型.A一1模型鉴定出符合加性-显性的具有最大遗传效应的一对主基因的存在,B一2模 型鉴定出符合加性一显性的具有最大和次大遗传效应的两对主基因的存在 A一1模型分布 参数的遗传参数的极大似然估计值分别为:m4=124.61,m5=132.31,d=33.99,h=22.40,B1 群体的2成分分布比例不呈1:1的分离比(x2=818,P=0.0042),B2群体的2成分分布比例 呈1:1的分离比(X2=0.18,P=0.67).若株高符合B-2模型,其遗传参数估计值分别为: m4=124.59,m5=132.80,d=33.92,d6=0.72,ha=22.12,h6=-0.19. 在A-1模型基础上进行多基因存在的鉴定结果为:入=29.70(P=5.6×106),说明 多基因存在,其遗传参数估计为:m =130.0670,d=34.7233,h=21.7356,d= -5.440, -6.5717,c2=192493.c=10.5045,c0≈0.0,从而B1,B2群体多基因遗传力分别为19.78% 和0.0.在B-2模型基础上进行多基因存在也有类似的结果. 利用下2群体进行主基因存在鉴定的结果亦列于表2.成分分布数为4的2对完全显性主 基因遗传模型的A1C值最小,说明株高由表现为完全显性的2对主基因所控制。4个成分分布 平均数的极大似然估计值分别为158.48,14183,111.40和94.76,其方差均为65.36.由此可得 m6=126.62,两主基因的加性效应d,=23.54和d=8.32,主基因遗传方差g=467.4078 主基因费传率h2.=82.89%.4个成分分布所占比例并不呈9:3:3:1(入=56.19.P接近0) 这可能是由于第1与2成分分布平均数之间和第3与4成分分布平均数之间较接近,使相应的 观测值归组模糊,造成不呈分离比例。在B一5模型的基础上进行多基因存在的鉴定结果为 A=9.29(P=0.0023),说明多基因存在.若对F2群体的表型方差进行副分,则多基因的遗传 方差,=44.9244,多基因遗传率h品,=797%.以上述F2群体分离分析结果的4个成分分 布按9:3:3:1的分离比例混合构成样本容量为512的F2模拟群体,按E-5模型进行参数 估计.重复500次,得到分布参数和遗传参数的平均数与标准误(见表3).从表3可知,①除 成分分布比例外,分布参数和遗传参数的模拟平均值与真值均较接近:@遗传参数的变异大于 分布参数的变异;③二阶参数的变异大于一阶参数的变异;④成分分布混合比例在500次中只 有53.2%是符合9:3:3:1的分离比例的,这可能是由于第1、2成分分布平均数之间和第 3、4成分分布的平均数之间较接近所造成的. 5讨论 比较本文中利用F2群体与利用B1和B2群体进行主基因鉴定的结果,发现两者的结果是 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
第 期 章元 明等 利用回交 和 及 群体鉴定数量性状两对主基因 多基因混合遗传模型 其中 , 二奢 心 嵘 。 利用 和 群体鉴 定多基 因存在的算法可仿此进行 本文作者应用 十十 语言编制了以上全套 算法的软件 和 利 用 群体鉴 定主基因和利用亲本 、 与 鉴定多基 因的存在 、 利用 和 群 体鉴 定主基因的存在 和 利用亲本 、 、 和 群体鉴定多基因的存在 , 由此 计算复杂 的工作变得十分简单 , 读者如有需要可与作者联系 应用举例 根据水稻南京 号 广丛杂交组合 。 群体 ‘ , 鉴定主基因存在的结果见表 由表 可知 , 一 和 一 模型的 值相对较小 , 一 模型为最优遗传模型 , 一 模型为次优 模型 一 模型鉴 定出符合加性 一 显性的具有最大遗传效应的一对主基因的存在 , 一 模 型鉴 定出符合加性 一 显性的具有最大和次大遗传效应的两对主基因 的存在 一 模型分布 参数的遗传参数的极大似然估计值分别为 , , , 咒 , 群体的 成分分布 比例不呈 的分离 比 尸 , 尸 , 群体的 成分分布比例 呈 的分离 比 尸 , 尸 若株高符合 一 模型 , 其遗传参数估计值分别为 , , 。 , 。 , 。 , 。 一 在 一 模型基础上进行多基 因存在的鉴定结果为 入 了 尸 乃 火 一 “ , 说明 多基因存在 , 其遗传参数估计为 二 , 二 , , 司 一 ,【川 一 , 心 二 , , 军 。 。嵘 。 、 , 从而 , 群体多基因遗传力分别为 和 在 一 模型基础上进行多基因存在也有类似的结果 利用 群体进行主基因存在鉴 定的结果亦列 于表 成分分布数为 的 对完全显性主 基因遗传模型 的 值最小 , 说明株高 由表现为完全显性的 对主基因所控制 个成分分布 平均数的极大似然估计值分别为 , , 和 , 其方差均为 由此可得 , 。。 , 两主基 因的加性效应 。 和 。 二 , 主基因遗传方差 。轰 。 · , 主基 因遗传率 众 。 二 · 个成分分布所占 比例并不呈 入 , 尸接近 , 这可能是 由于第 与 成分分布平均数之 间和第 与 成分分布平均数之 间较接近 , 使相应的 观测值归组模糊 , 造成不呈分离 比例 在 一 模型的基础上进行多基因存在 的鉴定结果为 入 尸 , 说明多基因存在 若对 群体的表型方差进行剖分 , 则多基因的遗传 方差 咭 。 · , 多基因遗传率 嵘 。 · · 以上述 群体分离分析结果的 个成分分 布按 的分离 比例混合构成样本容量为 的 模拟群体 , 按 一 模型进行参数 估计 重复 次 , 得到分布参数和遗传参数的平均数与标准误 见表 , 从表 可知 , ①除 成分分布比例外 , 分布参数和遗传参数的模拟平均值与真值均较接近 ②遗传参数的变异大于 分布参数的变异 ③二阶参数的变异大于一 阶参数的变异 ④成分分布混合 比例在 次中只 有 是符合 的分离 比例的 , 这可能是 由于第 、 成分分布平均数之间和第 、 成分分布的平均数之 间较接近所造成 的 讨 论 比较本文中利用 群体与利用 和 群体进行主基因鉴定的结果 , 发现两者的结果是
生物数学学报 第15卷 相对一致的,并且与利用亲本、F1、B1、B2和F26个世代的联合分析结果(另文报道)也是一 致的.通过F?群体及其模拟研究发现,若存在两对主基因时,各成分分布比例往往不符合孟 德尔分离比例,这可能是由于成分分布数较多,其平均数间差异相对于标准差而言是较小的, 致使观测值归组棋糊所致 Table 2 e Genetic Models B1 and B2 A AIC排序 AIC AC排序 A-0 -709.020 1422.04 5 -2293.170 4590.340 7 A-1 -638.246 1288.491 -2124.873 4261747 A-2 -706.261 1422522 -2293.171 4596.341 A-3 901.720 -2124.87 4259.71 -706.28 1424.570 -2293,172 4594.34 B-1 -2117.561 4271.121 B-2 -638.246 1292.492 2 -2124.872 4277743 B=3 -701.119 1414.237 3 2293.170 4610.339 B-4 -702.95 1415.91 -2293.16 4600.33 B-5 -901.63 1815.273 9 -2115.440 4244880 1 B-6 -901.720 1813.439 8 -2121.627 4253.254 2 表3聚特卡罗模期结果(重复500次) Table 3 The Results of Monte Carlo Simulation(500 Replications) 参数 平均数 标准阀 变异系数() 变异度 158.5553 0.0441 0.62 155.4102w161.3672 1413835 0.0891 1.41 12520021460431 11.3964 0.0815 105.679216.7391 0.122 2.9 75.9693102.043 64.206 0.3800 13.24 46.8203w100.0028 m 126.3900 0.0700 1.24 115.6953w130.5042 23.5794 0.0426 4.04 20.572126.1612 85859 0.034 6.847615.065 473,4012 1.668 7.88 365.5180626.3334 h2 0.8663 0.0029 7.31 0.68131.0000 在鉴定主基因存在时,王建康等4(1997)和盖钧镒等回(1998)是首先确定成分分布数然 后确定遗传模型的,本文是通过AC准则比较具有一定遗传背景遗传模型的A1C值来确定遗 传模型以及相应分离群体的成分分布数.这就避免了具有相同成分分布数时不能区分是一对主 基因控制的还是两对主基因控制的缺陷.例如,用文献2,4的方法,F2群体由2个成分分布 1994-2009 China Academie Joural Electronic Publishing House.All rights reserved.http://www.cnki.net
生 物 数 学 学 报 第 卷 相对一致的 , 并且与利用亲本 、 、 、 和 个世代的联合分析结果 另文报道 也是一 致的 通过 群体及其模拟研究发现 , 若存在两对主基因时 , 各成分分布比例往往不符合孟 德尔分离比例 , 这可能是 由于成分分布数较多 , 其平均数间差异相对于标准差而言是较小的 , 致使观测值归组模糊所致 表 利用 , 和 群体或 群体鉴定主签因存在的极大对数似然函数值 和 值 一 模型 排序 口 排序 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 表 镶特卡罗棋拟结果 贡复 次 平均数 变异系数 变异幅度 已么生认 、 拜 、 标准误 一 拼科 ,人 、 、 、 拜口 通己 、 一 , 、 、 、 、 已 口 , 九 在鉴定主基因存在时 , 王建康等 和 盖钧谧等 是首先确定成分分布数然 后确定遗传模型 的 , 本文是通过 准则 比较具有一定遗传背景遗传模型的 值来确定遗 传模型以及相应分离群体的成分分布数 这就避免了具有相同成分分布数时不能区分是一对主 基因控制的还是两对主基因控制的缺陷 例如 , 用文献 口 , 的方法 , 群体 由 个成分分布
第3期 元明等:利用回交B:和B?及F?群体鉴定数性状两对主蓄因十多基因混合遭传模型 365 构成,株高由1对主基因控制,从本文的分离分析结果看,这2成分分布中的每一成分分布着 是2个成分分布的登加。但是,文献[2,4的先确定成分分布数再确定遗传模型的方法能方便 地确定分布谷值.在鉴定多基因存在时,王建康等(1997)和盖钩镒等(1998))在设置H0和 H。时仅考虑了多基因是否存在的二阶参数而忽略了多基因存在与否的一阶参数,本文在这 问题上进行了补充,以全面考虑了多基因是否存在。在多基因存在的似然比检验中,其自由度 并不是都为1,而是H和H。相差的遗传参数个数 本文是通过利用个别分离世代先确定主基因的对数和作用方式,其模型符号暂用A和B 表示;然后通过利用亲本、F】和个别分离世代的联合鉴定多基因存在,以最终确定模型的类 室侧如若第1步为人山热道第2步又鉴定出有多基因作用则最终枫应清华定 在估计样本似然函数中的分布参数时,一般是采用EM算法[ 时,若采用EM算法就会出现估计环境方差时不能利用F?或B1和B2群体成分分布的信息, 即在参数估计时没有把二阶分布参数的数量遗传学意义的关系体现出来本文采用的IECM算 法从参数估计角度体现了分布参数之间的数量造传学意义,也提高了估计精度. [参考文献 川邀钩管荣,王建.植物数量性状QT7L体系检测的传试验方法世界科技研究与发混1999,21(1)3440 4021 利用回交世代或乃家系世代鉴定数量性状主基因-多基因混合传模型[作物学报。199 王建康。邀物位。合型的理论及其应用,生数华学报195.107? ,24位利用杂种?世代姿定数量性状主基因一多基因混合途传模型并估计其这传效应川遗传学粉 、阁R物奇件装装做半南京江茶科技证让应0吃一 wartJ.The analysis of qu antitative traits for simple genetic models from parental,F:and 7]Fernando RL.The finit c,197,734)695 tanee Thar Cenet.1994.(5):573-580 the mixed Gai JY,Wans JK.Identification and estimation ofaQTL model and its effects Theer Appl Genet 1998,97(7):1162-1168. Hoeschele L.Statistical techniques for detectionof major genes in animal breeding data Theor ApplGenet. 1988,76(3):311-319. [10]KnottSA.Haley CS,Thanpson R.Methods of segregation analysis for animal breeding data:acomparison 1p0wer小Hered,192,G8A4:299311 [11]Knott SA.Haley CS.Thanpson R.Methods of segregation analysis for animal breeding data:parameter iSonetMood Dectingjor ge inanF populn 50(2):512-516 [Rubin D B.Maximum likelhood estimation via the ECM algorithm:a general framework B10 metrika,1993,80(2):267-278. [1Paterson A H,Lander ES,Hewitt JD.et a.Resolution of quantitative traits into mendelian factors by using a complete RFLP linkage map Nature,1988,335(20):721-726. 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
第 期 章元明等 利用回交 和 及 群体鉴定数盘性状两对主荃因 多荃因混合遗传棋型 构成 , 株高由 对主基 因控制 , 从本文的分离分析结果看 , 这 成分分布中的每一成分分布都 是 个成分分布的叠加 但是 , 文献 【 ,习的先确定成分分布数再确定遗传模型 的方法能方便 地确定分布谷值 在鉴定多基因存在时 , 王建康等 州司 和 盖钧槛等 ‘ 在设置 。 和 。 时仅考虑 了多基因是否存在的二 阶参数而 忽略了多基因存在与否的一阶参数 , 本文在这一 问题上进行了补充 , 以全面考虑 了多基因是否存在 在多基因存在的似然 比检验中 , 其 自由度 并不是都为 , 而是 。 和 。 相差的遗传参数个数 本文是通过利用个别分离世代先确定主基因的对数和 作用方式 , 其模型符号暂用 和 表示 然后通过利用亲本 、 和个别分离世代的联合鉴定多基 因存在 , 以最终确定模型 的类 型 例如若第 步为 一 模型 , 第 步 又鉴定出有多基 因作用 , 则最终模型应该是 一 在估计样本似然 函数中的分布参数时 , 一般是采用 算法 一 ,‘”一‘ , ’” 在多基因鉴定 时 , 若采用 算法就会出现估计环境方差时不能利用 或 和 群体成分分布的信息 , 即在参数估计时没有把二阶分布参数的数量遗传学意义的关系体现 出来 本文采用 的 算 法从参数估计角度体现 了分布参数之 间的数量遗传学意义 , 也提高了估计精度 参 考 文 献 盖钧锐 , 管荣展 , 王建康 植物数量性状 体系检测的遗传试验方法 【 世界科技研究与发展 , , 一 盖钧锐 , 王建康 利用回交世代或 凡 家系世代鉴定数量性状主基因 一 多基因混合遗传模型 【 作物学报 , 一 · 王建康 , 盖钧锐 · 混合模型的理论及其应用 【 生物数学学报 , , 一 ’ 王建康 , 盖钧谧 利用杂种 世代鉴定数量性状主基因 一 多基因混合遗传模型并估计其遗传效应 【 遗传学报 , , 一 〔』马育华 植物育种的数量遗传学基础 南京 江苏科技出版社 , · 一 · 』 , , 【」 。。 , , 一 【」 。 【 』 。 。 。 , , 一 」 , 瓜 【」 刀 , , 一 」 【〕 尸刀 。。 。 , , 一 【 , , 【」 ‘夕 , , 一 【 」 , 一 , 一 二 ‘夕, , 一 【 , 扭 , , 【」 , ‘ 。。 。, , , 一 【习 , 【〕 蓄。 。。 蓄 , , 一 · 【 , , , 」 。 二 , 一 , 一
366 生物数学学报 第15卷 Pamete migemerie mrith pe 3 iometrics,1994,50(1):128-139 [1章元明.羞钩徽,数量性状主基因+多基因混合遮传分析中鉴定多基因存在的ECM算法),生物数学学报,199的, 144429-434 Identification of Two Major Genes Plus Polygenes Mixed Inheritance Model of Quantitative Traits in B and B2,and F2 ZHANG Yuan-ming CAI Jun-yi WANG Jian-kang (Laboratary Center,Henan Academy of Agricultural Sciences,Henan Zhengzhou 450002 China) Abstract:Both oTl mapping and the se ation analysis indicated that maior ethe iterated BCM(M)agorithm makes it possible.n the present rmation Criter mates of paran crsdcOmp6nentdtabionslashefirtordcrorsecondordergenctic parameters.From P P2.F1B and B2 or P,P2 F and F2.the likelihood ratio test is used to test the existence of polygenes.An example of the inheritance of rice plant height is provided Chindmc JoumaEer Pblin Hols hip
生 物 数 学 学 报 第 卷 【 」 , 」 ‘ , , 一 【 章元 明 , 盖钧锐 数量性状主基因 多基因混合遗传分析中鉴定多基因存在的 算法 生物数学学报 , , 一 , 一 一 夕乙 二 二 二 二 , 夕 夕 二 二 二‘ 亡刀 亡‘ 。二 才。 夕乙 二 二 二 二 才 , 二 夕 夕 二 亡二 , 乞 。夕 二 。了 二 夕 。 一 军 二 , 二 二 二夕 夕 艺 、 二 艺 二 , 二 二 二 夕 二 乞。 。 , ’ , , , 一 , , 。 , , , , 一 七