正在加载图片...
6期 章元明等:数量性状分离分析中分布参数估计的ECM算法 701 3鉴定数量性状主+多基因混合遗传模型的EQM算法 31ECM算法 ECM算法是BM算法的拓展,分为E步骤和QM步骤两步。E步骤与DM算法的E步 骤是一致的,见文献[7],这里从略。第1次迭代的QM步骤是分S步进行Q(”)的极大 化。G={g,(0;s=1,“,S;是参数估计前选择的S个日的函数,这里g1(0是似然函数中除 分布平均数外的参数,g:(日是除多基因方差组分外的参数,8:(日是除环境方差组分外的参 数。若多基因方差组分不存在则S=2,否则S=3。在第什1次迭代中,首先进行E步骤,然 后进行S个QM步骤。对于=1,S,在g,(Θ=g,(日“)和日参数空间极大化Q(阳1 日)以获得日的条件极大似然估计值日”,或者说,EQM算法第1次迭代的第,个QM步 骤是获得日*6)使 0(θ)I旧)≥Q(8旧6∈⊙ 0 完全资料似然函数的条件期望Q(日旧)的极大值点由下列公式确定 trD=∑w"n (3) L(yl旧-∑xn(ua=-0(s=1,…,s) 其中,wP是第:次迭代后第1个观测值归入第」个成分分布的后验概率,(口)是分布平均数 间的第m个约束条件,k是约束条件个数,:是样本容量。取日”=日5),以此进行下 轮循环 32数量性状主+多基因混合遗传分析的ECM算法 数量性状主+多基因混合遗传分析的EQM算法由E步骤和23个CM步骤组成。其 E步骤与EQM算法的E步骤是一致的。QM:步骤是在固定多基因方差组分(=4,5,6) 和环境方差的条件下用迭代方法求分布平均数的条件极大似然估计:QM:是在固定环境方差 和QM:步骤中获得的分布平均数的条件下用迭代公式求多基因方差组分的条件极大似然估 计,QM3步骤是在固定QM,和CM,中获得的分布平均数和多基因方差组分条件下用迭代公 式求环境方差的条件极大似然估计。若涉及家系世代,QM:步骤中分布平均数条件极大似然 估计可按下列步骤进行:①若分布平均数间有约束条件,由约束条件和平均数公式得到的联 立方程组求Lagrange乘数X②由分布平均数公式求其估计值:③由分布平均数估计值得 到一阶遗传参数估计值及其表示的主基因方差组分,从而改变了家系群体成分分布方差④ 重复①③步骤直到平均数变化满足预定的精度为止。 为节省篇幅,本文的EQM算法均略去E步骤和估计分布平均数的QM,步骤,其符号 和样本似然函数参见文献[25],这里只列出多基因和误差两种方差的迭代公式。 33利用个别分离世代分离分析的ECM算法 331鉴定主基因存在ECM算法的迭代公式 F2或F,:世代鉴定主基因存在的样本以 然函数的形式参见文献[2,3。只是这里的成分分布是按前述的主基因型来确定的。记x、 和k分别是F2或F2:群体的第个观测值或家系平均数、样本容量和成分分布个数。QM:是 在固定成分分布平均数条件下求的条件极大似然估计,其迭代公式为: 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 3 鉴定数量性状主+ 多基因混合遗传模型的 IECM 算法 3. 1 ECM 算法[12 ] ECM 算法是 EM 算法的拓展, 分为 E 步骤和 CM 步骤两步。E 步骤与 EM 算法的 E 步 骤是一致的, 见文献[ 7 ], 这里从略。第 t 次迭代的 CM 步骤是分 S 步进行Q (ΗûΗ (t) ) 的极大 化。G= {g s (Η); s= 1, …, S }是参数估计前选择的S 个 Η的函数, 这里 g 1 (Η) 是似然函数中除 分布平均数外的参数, g 2 (Η) 是除多基因方差组分外的参数, g 3 (Η) 是除环境方差组分外的参 数。若多基因方差组分不存在则S = 2, 否则S = 3。在第 t+ 1 次迭代中, 首先进行 E 步骤, 然 后进行S 个CM 步骤。对于 s= 1, …, S , 在 g s (Η) = g s (Η {t+ (s- 1)öS } ) 和 Η参数空间极大化Q (Ηû Η (t) ) 以获得 Η的条件极大似然估计值 Η (t+ söS ) , 或者说, ECM 算法第 t 次迭代的第 s 个 CM 步 骤是获得 Η (t+ söS )使 Q (Η (t+ söS ) ûΗ (t) ) ≥Q (ΗûΗ (t) ) Η∈ ( (2) 完全资料似然函数的条件期望Q (ΗûΗ (t) ) 的极大值点由下列公式确定: Π (t+ 1) j = ∑ n 1 i= 1 w (t) j i ön1 (3) L (Y ûΗ) - ∑ k m = 1 Κm rm (Λ) öΗs = 0 (s = 1, …, S ) (4) 其中, w (t) j i 是第 t 次迭代后第 i 个观测值归入第 j 个成分分布的后验概率, rm (Λ) 是分布平均数 间的第m 个约束条件, k 是约束条件个数, n1 是样本容量。取 Η (t+ 1) = Η (t+ S öS ) , 以此进行下一 轮循环。 3. 2 数量性状主+ 多基因混合遗传分析的 IECM 算法 数量性状主+ 多基因混合遗传分析的 IECM 算法由 E 步骤和 2~ 3 个CM 步骤组成。其 E 步骤与 ECM 算法的 E 步骤是一致的。CM 1 步骤是在固定多基因方差组分 Ρ 2 j0 (j = 4, 5, 6) 和环境方差的条件下用迭代方法求分布平均数的条件极大似然估计; CM 2 是在固定环境方差 和 CM 1 步骤中获得的分布平均数的条件下用迭代公式求多基因方差组分的条件极大似然估 计; CM 3 步骤是在固定CM 1 和 CM 2 中获得的分布平均数和多基因方差组分条件下用迭代公 式求环境方差的条件极大似然估计。若涉及家系世代, CM 1 步骤中分布平均数条件极大似然 估计可按下列步骤进行: ① 若分布平均数间有约束条件, 由约束条件和平均数公式得到的联 立方程组求L agrange 乘数 Κi; ② 由分布平均数公式求其估计值; ③ 由分布平均数估计值得 到一阶遗传参数估计值及其表示的主基因方差组分, 从而改变了家系群体成分分布方差; ④ 重复①~ ③步骤直到平均数变化满足预定的精度为止。 为节省篇幅, 本文的 IECM 算法均略去 E 步骤和估计分布平均数的CM 1 步骤, 其符号 和样本似然函数参见文献[ 2~ 5 ], 这里只列出多基因和误差两种方差的迭代公式。 3. 3 利用个别分离世代分离分析的 IECM 算法 3. 3. 1 鉴定主基因存在 IECM 算法的迭代公式 F2 或 F2∶3世代鉴定主基因存在的样本似 然函数的形式参见文献[ 2, 3 ]。只是这里的成分分布是按前述的主基因型来确定的。记x i、n1 和 k 分别是 F2 或 F2∶3群体的第 i 个观测值或家系平均数、样本容量和成分分布个数。CM 2 是 在固定成分分布平均数条件下求 Ρ 2 1 的条件极大似然估计, 其迭代公式为: 6 期 章元明等: 数量性状分离分析中分布参数估计的 IECM 算法 701
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有