S43马氏链模型e 随着人类的进化,为了揭示生命的奧秘,人们越来越注重 遗传学的研究,特别是遗传特征的逐代传播,已引起人们 广泛的注意。无论是人,还是动、植物都会将本身的特征 遗传给下一代,这主要是因为后代继承了双亲的基因,形 成自己的基因对,由基因又确定了后代所表现的特征。本 节将利用数学的马氏链方法来建立相应的遗传模型等,并 讨论几个简单而又有趣的实例。 马氏链(马尔柯夫链)研究的是一类重要的随机过程,研 究对象的状态s(是不确定的,它可能取K种状态 s(=1,…,k之一,有时甚至可取无穷多种状态。在建模时 时间变量也被离散化,我们希望通过建立两个相邻时刻研 究对象取各种状态的概率之间的联系来研究其变化规律, 故马氏链研究的也是一类状态转移问题
§4.3 马氏链模型 随着人类的进化,为了揭示生命的奥秘,人们越来越注重 遗传学的研究,特别是遗传特征的逐代传播,已引起人们 广泛的注意。无论是人,还是动、植物都会将本身的特征 遗传给下一代,这主要是因为后代继承了双亲的基因,形 成自己的基因对,由基因又确定了后代所表现的特征。本 节将利用数学的 马氏链方法来建立相应的遗传模型等,并 讨论几个简单而又有趣的实例。 马氏链(马尔柯夫链)研究的是一类重要的随机过程,研 究对象的状 态s(t)是不确定的,它可能 取K种 状态 si(i=1,…,k)之一,有时甚至可取无穷多种状态。在建模时, 时间变量也被离散化,我们希望通过建立两个相邻时刻研 究对象取各种状态的概率之间的联系来研究其变化规律, 故马氏链研究的也是一类状态转移问题
例4.6设某商店经营情况可能有三种状态: 好(S1:利润丰厚)、一般(S2)和不好 (S3:亏损)。根据统计资料,上月状态为 S,下月状态为S的概率为p(=1,23; 户123),0p下1 例4.6中的关系既可用一转移矩阵表示 12 13 A=P21 22 P23 31 32
例4.6 设某商店经营情况可能有三种状态: 好(S1:利润丰厚)、一般(S2)和不好 (S3:亏损)。根据统计资料,上月状态为 Si,下月状态为Sj的概率为pij(i=1,2,3; j=1,2,3),0≤pij≤1 例4.6中的关系既可用一转移矩阵表示 = 31 32 33 21 22 23 11 12 13 p p p p p p p p p A
计+1时段状态 状态转移概率 S Sy S1土壤含 0.4 0.4 0 0.2 磷 S牧草合01 0.3 0.6 时段状L磷 0 态 羊体含 0.7 0 0.2 0.1 磷 S流失系 统外 0 0 0 研究此生态系统问题 率列表于下
例4.7 研究某一草原生态系统中物质磷的循环,考 虑土壤中含磷、牧草含磷、牛羊体内含磷和流失于 系统之外四种状态,分别 以S1,S2,S3和S4表示 这四种状态。以年为时间参数,一年内如果土壤中 的磷以0.4的概率被牧草生长吸收,水土流失于系统 外的概率为 0.2;牧草中的含磷以 0.6的概率被牛羊 吃掉而转换到牛羊体内,0.1的概率随牧草枯死腐败 归还土壤;牛羊体中的磷 以0.7的概率因粪便排泄 而还归土壤,又以自 身0.1的比率因屠宰后投放市 场而转移到系统外。我们可以建立一个马尔柯夫链 来研究此生态系统问题,其转移概率列表于下: 0 0 0 1 S4流失系 统外 0.7 0 0.2 0.1 S3羊体含 磷 0.1 0.3 0.6 0 S2牧草含 磷 0.4 0.4 0 0.2 S1土壤含 磷 i时段状 态 S4 S3 S2 S1 i+1时段状态 状态转移概率
相应的转移矩阵为: 0.40.400.2 0.10.30.60 M 0.700.20.1 且S+1=SM 首先,任一转移矩阵的行向量均为概率向量,即有(1) 马氏链模型的性质完全由其转移矩 阵决定,故研究马氏链的数学工 B=1(产=1,具是线性代数中有关矩阵的理论。 的炬阵被称为随机矩阵
相应的转移矩阵为: = 0 0 0 1 0.7 0 0.2 0.1 0.1 0.3 0.6 0 0.4 0.4 0 0.2 M 且S j+1=S jM 马氏链模型的性质完全由其转移矩 阵决定,故研究马氏链的数学工 具是线性代数中有关矩阵的理论。 首先,任一转移矩阵的行向量均为概率向量,即有 (1) (I , j=1,…,n) (2) (i=1,…,n) 这样的矩阵被称为 随机矩阵。 0 Pig 1 1 1 = = n j Pig
常染色体遗传模型」 在常染 继承 个基因, 父体—母体的基因型 。如果 我们所 AA AAAA AaAa aa (A、 a为表示 记为AA, Aa,aa。 AA Aa aa aa aa aa 下面给出后41 0 00 后代形成 每种基因型代[Aa0 0 基 双亲随机纬累的物假模型村软复,这些我付仅研究 个较简
常染色体遗传模型 下面给出双亲体基因型的所有可能的结合,以及其后代形成 每种基因型的概率,如 表所示。 在常染色体遗传中,后代从每个亲体的基因对中各继承一 个基因,形成自己的基因时,基因对也称为基因型。如果 我们所考虑的遗传特征是由两个基 因A和a控制的,(A、 a为表示两类基因的符号)那么就有三种基因对,记为AA, Aa,aa。 aa 0 0 0 1 Aa 0 1 0 后 AA 1 0 0 0 代 基 因 型 aa - aa Aa - aa Aa - Aa AA - aa AA - Aa AA - AA 父体——母体的基因型 双亲随机结合的较一般模型相对比较复杂,这些我们仅研究 一个较简单的特例
例48农场的植物园中某种植物的基因型为AA,Aa 和aa。农场计划采用AA型的植物与每种基因型植物 相结合的方案培育植物后代。那么经过若干年后, 这种植物的任一代的三种基因型分布情况如何? (a)假设:令n=0,1,2,。 (i)设an,bn和c分别表示第n代植物中,基因型为AA,Aa和aa 的植物占植物总数的百分比。令X(为第n代植物的基因型分 布: (n) 当n=0时 (0) 表示植物基因型的 初始分布(即培育 开始时的分布)
例4.8 农场的植物园中某种植物的基因型 为AA,Aa 和aa。农场计划采用 AA型的植物与每种基因型植物 相结合的方案培育植物后代。那么经过若干年后,这 种植物的任一代的三种基因型分布情况如何? (a)假设:令n=0,1,2,…。 (i)设an ,bn和cn分别表示第n代植物中,基因型 为AA,Aa和aa 的植物占植物总数的百分比 。令x (n)为第n代植物的基因型分 布: = n n n n c b a x ( ) 当n=0时 = 0 0 0 (0) c b a x 表示植物基因型的 初始分布(即培育 开始时的分布) 例4.8 农场的植物园中某种植物的基因型 为AA,Aa 和aa。农场计划采用 AA型的植物与每种基因型植物 相结合的方案培育植物后代。那么经过若干年后, 这种植物的任一代的三种基因型分布情况如何?
显然有a0+b0+C0 (i)第n代的分布与第n-1代的分布之间的关系是通过表 52确定的。 (b)建模 根据假设(),先考虑第n代中的AA型。由于第n-1代的AA 型与A型结合。后代全部是AA型;第n-1代的Aa型与AA 型结合,后代是AA型的可能性为1/2,而第n-1代的aa型与 AA型结合,后代不可能是AA型。因此当n=1,2.时 1·a.,+-b.,+0 即 a.=a.,+-b n-1 (4.2) 类似可推出bn=bn1+cn-1Cn=0(44) (4.3)
(b)建模 根据假设(ii),先考虑第n代中的AA型。由于第n-1代的AA 型与AA型结合。后代全部是AA型;第n-1代的Aa型与AA 型结合,后代是AA型的可能性为 1/2,而 第n-1代的aa型与 AA型结合,后代不可能 是AA型。因此当n=1,2…时 1 1 0 1 2 1 1 − − − = + + n n n n a a b c 1 1 2 1 n = n− + n− a a b 即 类似可推出 1 1 2 1 bn = bn− + cn− cn=0 显然有 (ii)第n代的分布与 第n-1代的分布之间的关系是通过表 5.2确定的。 1 a0 + b0 + c0 = (4.2) (4.3) (4.4)
将(4.2)、(4.3)、(4.4)式相加,得 +bn+Cn=am+bm+c 根据假设(,可递推得出: a tb tc=atb+c=l 对于(42)式(4.3)式和(4.4)式,我们采用矩阵形式简记为 x()=M(m),n=1,2,…(4.5) 其中 2 031,x)=b(注:这里M为转移矩阵的位置) 00
将(4.2)、(4.3)、(4.4)式相加,得 n + n + n = n−1 + n−1 + n−1 a b c a b c 根据假设(I),可递推得出: an + bn + cn = a0 + b0 + c0 = 1 对于(4.2)式.(4.3)式和(4.4)式,我们采用矩阵形式简记为 x (n) = Mx(n−1) ,n = 1,2, 其中 = = n n n n c b a M x ( ) , 0 0 0 1 2 1 0 0 2 1 1 (注:这里M为转移矩阵的位置) (4.5)
由(4.5)式递推,得 x()=Mn1)=M2x(n-2)=…=M"x)(4.6) (4.6)式给出第n代基因型的分布与初始分布的关系。 为了计算出M,我们将M对角化,即求出可逆矩阵P和对角 库D,使 MEPDP-1 因而有 M=PDP1,m=1,2, 其中 0 D"= 0 33 这里1,气2,孔是矩阵M的三个特征值。对于(45式 中的M,易求得它的特征值和特征向量: 1=1,2=12,3 =0
由(4.5)式递推,得 ( ) ( 1) 2 ( 2) (0) x Mx M x M x n n n n = = = = − − (4.6) (4.6)式给出第n代基因型的分布与初始分布的关系。 为了计算出Mn,我们将M对角化,即求出可逆矩 阵P和对角 库D,使 M=PDP-1 因而有 Mn=PDnP-1 , n=1,2,… 其中 = = n n n n D 3 2 1 3 2 1 0 0 0 这里 , , 是矩 阵M的三个特征值。对于 (4.5)式 中的M,易求得它的特征值和特征向量: =1, =1/2, =0 1 2 3 1 2 3
因此 D=0 2 2 0 所以 P=le,:e: e 100 通过计算,P1=P,因此有 PD"P-x( 00-1-2|b 000
因此 = − = − = = 1 2 1 0 1 1 0 0 1 , 0 0 0 0 2 1 0 1 0 0 1 2 3 D e e e 所以 = = − − 0 0 1 0 1 2 1 1 1 1 2 3 P e e e 通过计算,P -1=P,因此有 ( ) 1 (0) x PD P x n n − = − − − − 0 0 0 0 0 1 0 1 2 1 1 1 0 0 0 0 2 1 0 1 0 0 0 0 1 0 1 2 1 1 1 c b a n =