种旁的遗传评估(三 BD育种值的计
种畜的遗传评估(三) BLUP育种值的估计
随着数理统计学与线性模型理论,计算机 科学与互联网络技术的迅速发展,宇畜育 种值计的方法发生了根本的变化。 Q。以 Henderson为代表所发展起来的BLUP oo Best Linear Unbiased Prediction )Atp 值计法,将畜禽遗传育种的理论与实践 段。 带入了个新的发展阶
◼ 随着数理统计学与线性模型理论、计算机 科学与互联网络技术的迅速发展,家畜育 种值估计的方法发生了根本的变化。 ◼ 以Henderson为代表所发展起来的BLUP (Best Linear Unbiased Prediction)育种 值估计法,将畜禽遗传育种的理论与实践 带入了一个新的发展阶段
线性模型基础知识 模型(Mode/) 模型是描述观察值与影响观察值变异性的各因子之间 的关系的数学方程式 分类 真实模型——非常准确地模拟观察值的变异性,模 型中不含有未知成分 理想模型——根据研究者所掌握的专业知识建立的 尽可能接近真实模型的模型 操作模型——用于实际统计分析的模型,它通常是 理想模型的简化形式
一、线性模型基础知识 ◼ 模型(Model) 模型是描述观察值与影响观察值变异性的各因子之间 的关系的数学方程式 分类 ◼ 真实模型——非常准确地模拟观察值的变异性,模 型中不含有未知成分 ◼ 理想模型——根据研究者所掌握的专业知识建立的 尽可能接近真实模型的模型 ◼ 操作模型——用于实际统计分析的模型,它通常是 理想模型的简化形式
因子 离散型 通常表现为若干个有限的等级或水平 ■固定因子——有意识地抽取若干个特定的水平,目 的是对这些水平的效应进行估计或进行比较,如年 效应 随机因子—因子的若干水平可看作是来自该因子 的所有水平所构成的总体的随机样本,目的是要通 过该样本去推断总体,如个体的遗传效应。 连续型 它呈现连续性变异,通常是作为影响观察值的协变 量(回归变量)
◼ 因子 离散型 ◼ 通常表现为若干个有限的等级或水平 ◼ 固定因子 ——有意识地抽取若干个特定的水平,目 的是对这些水平的效应进行估计或进行比较 ,如年 效应 ◼ 随机因子——因子的若干水平可看作是来自该因子 的所有水平所构成的总体的随机样本,目的是要通 过该样本去推断总体,如个体的遗传效应。 连续型 ◼ 它呈现连续性变异,通常是作为影响观察值的协变 量(回归变量)
线性模型( Linear mode) 口线性模型是指在模型中所包含的各个因子是以 相加的形式影响观察值,即它们与观察值的关 系为线性关系,但对于连续性的协变量也允许 出现平方或立方项 口一个线性模型应由3个部分组成: 数学方程式 2.方程式中随机变量的期望和方差及协方差 3.假设、约束和限制条件
◼ 线性模型(Linear model) 线性模型是指在模型中所包含的各个因子是以 相加的形式影响观察值,即它们与观察值的关 系为线性关系,但对于连续性的协变量也允许 出现平方或立方项 一个线性模型应由3个部分组成: 1. 数学方程式 2. 方程式中随机变量的期望和方差及协方差 3. 假设、约束和限制条件
线性模型举例 母牛的乳脂量生产成绩表( Schaeffer lr,1993) 初产年龄(等级) 分组 2 3 114 143 145 150 犊季节 109 103 163 117 数学方程式 D=H+a2+b,+ 和方差:E(yk)=+a1+b,E(ek)=0V()=(em)=a2 ■假设和约束杀件 口所有母牛都来自同一品种 口所有母牛都在相同的环境下以相同的饲养方式饲养 口所有的母牛都来自同一公牛 口所有的母牛的母亲对母牛的乳脂量无影响
◼ 数学方程式: ◼ 期望和方差: ◼ 假设和约束条件: 所有母牛都来自同一品种 所有母牛都在相同的环境下以相同的饲养方式饲养 所有的母牛都来自同一公牛 所有的母牛的母亲对母牛的乳脂量无影响 分组 初产年龄(等级) 1 2 3 产 犊 季 节 1 114 143 145 150 2 109 103 163 117 ijk i j ijk y = + a + b + e 线性模型举例 母牛的乳脂量生产成绩表(Schaeffer L R,1993) ijk ai bj E( y ) = + + E(eijk ) = 0 2 ( ) ( ) ijk ijk i V y =V e =
■线性模型的分类 □固定效应模型( fixed model) ■如一个模型中除了随机误差外,其余所有的效应均为 固定效应,则称此模型为固定效应模型或固定模型 □随机效应模型( random model) 若模型中除了总平均数外,其余的所有效应均为随机 效应,则称此模型为随杋效应模型或随机模型 □混合模型( mixed model) 若模型中除了总平均数和随机误差之外,既含有固定 效应,也含有随机效应,则称之为混合模型
◼ 线性模型的分类 固定效应模型(fixed model) ◼ 如一个模型中除了随机误差外,其余所有的效应均为 固定效应,则称此模型为固定效应模型或固定模型。 随机效应模型(random model) ◼ 若模型中除了总平均数外,其余的所有效应均为随机 效应,则称此模型为随机效应模型或随机模型 混合模型 (mixed model) ◼ 若模型中除了总平均数和随机误差之外,既含有固定 效应,也含有随机效应,则称之为混合模型
3传统的送择指数法的蒸本设是不存在影响现察值的系 环成,减者在用对除了灰绕环应。 遗憾的是这个基本假设在几乎所有实际情况下都是不能成 t的,如乳用母牛饲养在管理条件不同的牛群中 ■为克以上陷, Henderson于1948年提出了BLUP方法, 即最佳性无偏预测,这个统计方法可同时估计固定效应 (例如系统环境效应)和育种值。传统的送择指数是有 已知固定效应的BU尸方法的一种特殊情形 ■随着计算机技的高速发展,使这一方法的实际应用成为 可能,目前BLU尸活已成为世界各国(尤某是发达国宇)家 畜遗传评定的规范方法
◼ 传统的选择指数法的基本假设是不存在影响观察值的系统 环境效应,或者在使用前剔除了系统环境效应。 ◼ 遗憾的是这个基本假设在几乎所有实际情况下都是不能成 立的,如乳用母牛饲养在管理条件不同的牛群中 ◼ 为克服以上缺陷,Henderson于1948年提出了BLUP方法, 即最佳线性无偏预测,这个统计方法可同时估计固定效应 (例如系统环境效应)和育种值。传统的选择指数是具有 已知固定效应的BLUP方法的一种特殊情形 ◼ 随着计算机技术的高速发展,使这一方法的实际应用成为 可能,目前BLUP法已成为世界各国(尤其是发达国家)家 畜遗传评定的规范方法
二、BLUP的基本原理 般泥合模型可表示为: y=Xb+ Zu+e y是所有观察值构成的向量 b是所有固定效应(包括)构成的向量 X是固定效应的关联矩阵 Ⅱ是所有随机效应构成的向量 z是随机效应的关联矩阵 e是随机残差向量 ■随机变量的数学期望E(b=bE(u)=0E(e)=0E(y)=Mb ■方差协方差矩阵结构 L G 0
二、BLUP的基本原理 ◼ 一般混合模型可表示为: 是所有观察值构成的向量 是所有固定效应(包括)构成的向量 是固定效应的关联矩阵 是所有随机效应构成的向量 是随机效应的关联矩阵 是随机残差向量 ◼ 随机变量的数学期望: ◼ 方差-协方差矩阵结构: y b X u Z e y = Xb + Zu + e E(b) = b , E(u) = 0 , E(e) = 0 , E( y) = Xb = 0 R G 0 e u Var
■BLUP的统计特性 口可估函数:Ly 口预测函数:Kb+M 口预测误差:Kb+M-ly BLUP分析的实质是利用观察值的一个线性函数(Ly)对 固定效应和随机效应的任意线性可估函数(Kb+Mlt) 进行估计和预测,要求同时满足预测的无偏性和预测误差 方差最小(最佳)两个条件,由此得到b的最佳线性无偏 估计值(BLUE),u的最佳线性无偏预测值(BLUP)
◼ BLUP 的统计特性 可估函数: 预测函数: 预测误差: BLUP分析的实质是利用观察值的一个线性函数( )对 固定效应和随机效应的任意线性可估函数( ) 进行估计和预测,要求同时满足预测的无偏性和预测误差 方差最小(最佳)两个条件,由此得到 的最佳线性无偏 估计值(BLUE), 的最佳线性无偏预测值(BLUP) Kb + M u L y Kb + M u − L y L y Kb + M u b u