回归分析是对变量与变量之间的某种相依关系 这种关系可以用回归函数来表示有时我们只需要 知道某些变量的不同取值对一个变量有没有影响? 对这样的问题我们是采用方差分析比如 例:某灯泡厂用四种不同配料方案制成的灯丝生 产了四批灯泡在每批灯泡中取若干个做寿命试验, 它们的寿命如下: 种 寿命(小时 1600.1610.1650.1680.1700.1720.1800 016 1580.1640 40.1700.1750 1460.1550.1600.1620.1660.1740.1820.1640 1510.1520.1530.1570.1600.1680
回归分析是对变量与变量之间的某种相依关系. 这种关系可以用回归函数来表示.有时,我们只需要 知道某些变量的不同取值对一个变量有没有影响? 对这样的问题我们是采用方差分析.比如: 例:某灯泡厂用四种不同配料方案制成的灯丝生 产了四批灯泡,在每批灯泡中取若干个做寿命试验, 它们的寿命如下: 品种 寿命(小时) 1600,1610,1650,1680,1700,1720,1800 1580,1640,1640,1700,1750 1460,1550,1600,1620,1660,1740,1820,1640 1510,1520,1530,1570,1600,1680 A1 A2 A3 A4
这里研究的问题是灯丝的不同配料方案对寿命 有无影响灯泡的寿命是我们考察指标,而影响这 指标有可能是灯丝的品种在这里我们称之为因子, 而选取了四个品种我们之为因子的四个水平这种 情况,我们称为单因子四水平试验对这种试验的分 析称为单因子方差分析.一般单因子r水平试验数据 可列表如下 水平水平 试验结果 X 1112,51n1 2122,42n r14r2 brn
这里研究的问题是灯丝的不同配料方案对寿命 有无影响,灯泡的寿命是我们考察指标,而影响这一 指标有可能是灯丝的品种,在这里我们称之为因子, 而选取了四个品种,我们之为因子的四个水平.这种 情况,我们称为单因子四水平试验.对这种试验的分 析称为单因子方差分析.一般单因子r水平试验数据 可列表如下 水平水平 试验结果 A1 A2 A r 1 11 12 1 , , , n x x x 2 21 22 2 , , , n x x x 1 2 , , , r r r rn x x x
在A水平下的各种试验指标值可看作同一总体的观测 值,因此,有r个总体,分别记作X1,X2…X 我们还假定X1~N(,a2),如果因子A对试验指标没有 显著影响,那么Ⅹ1,X2…,X的分布相同,即 H 成立因此,因子A对试验指标有没有影响就是检验上述 假设是否正确,这是一个等方差的假设检验问题,这个 问题可以用前面已讲的假设检验方法检验.但至少要检 验的r-1个等式.方法比较烦琐.方差分析法就比较简单
, , , Ai 1 2 r 在 水平下的各种试验指标值可看作同一总体的观测 值,因此,有r个总体,分别记作X X X 2 2 ~ ( , ), , , , i r N X X i 1 我们还假定X 如果因子A对试验指标没有 显著影响,那么X 的分布相同,即 0 1 2 : H = = = r 成立.因此,因子A对试验指标有没有影响就是检验上述 假设是否正确,这是一个等方差的假设检验问题,这个 问题可以用前面已讲的假设检验方法检验.但至少要检 验的r-1个等式.方法比较烦琐.方差分析法就比较简单
引进记号 ∑,X=∑∑X S=∑(x-)2SE=∑∑(X-x) S=∑∑(X-X)=∑n(X-X) i=1j=1 由于∑∑(X-Xx-X)=0 故有 SST=∑∑(X-X)2=∑∑(X-X+x,-X) i=1j=1 i=1j=1 ∑∑(X-x,)2+∑∑(x,-x)2=SE+Ss4
引进记号: 1 1 1 1 1 , i i n n r i ij ij j i j i X X X X n N = = = = = 2 1 1 ( ) i r n ij i j SST X X = = = − 2 1 1 ( ) , i r n ij i i j SSE X X = = = − 2 2 1 1 1 ( ) ( ) i r r n i i i i j i SSA X X n X X = = = = − = − 1 1 ( )( ) 0 i r n ij i i i j X X X X = = 由于 − − = 2 2 1 1 1 1 ( ) ( ) i i r r n n ij ij i i i j i j SST X X X X X X = = = = = − = − + − 故有 2 2 1 1 1 1 ( ) ( ) i i r r n n ij i i i j i j X X X X SSE SSA = = = = = − + − = +
Xn=1+6n6n~N(0,a2) ∑En ∑∑ J N 则X=1+EX=+E SE=∑∑(1+En1-)=∑∑(En-)2 J SR=∑n(4+--E) SST=∑∑(1+n-1-8)2 i=1j=1
2 1 1 1 1 (0, 1 1 , 1 i i ij i ij ij n n r i ij ij j i j i r i i i X N n N n N = = = = = + = = = 记 ) 则 X X i i i = + = + 2 2 1 1 1 1 ( ) ( ) i i r r n n i ij i i ij i i j i j SSE = = = = = + − − = − 2 1 ( ) r i i i i SSR n = = + − − 2 1 1 ( ) i r n i ij i j SST = = = + − −
并且 E(S5)=∑EC∑(,E)=∑(n-12=(N-n)2 E(ST=E∑∑(+60-元-)2 1=1 J ∑∑(A-m)2+E∑∑(n-E)2 =∑∑(1-)2+(N-12 因此 E(S9)∑∑(1-p)2+(r-12
并且 因此 2 2 2 1 1 1 ( ) ( ( ) ) ( 1) ( ) i r r n ij i i i j i E SSE E n N r = = = = − = − = − 2 1 1 ( ) [ ( ) ] i r n i ij i j E SST E = = = + − − 2 2 1 1 1 1 ( ) [ ( ) i i r r n n i ij i j i j E = = = = = − + − 2 2 1 1 ( ) ( 1) i r n i i j N = = = − + − 2 2 1 1 ( ) ( ) ( 1) i r n i i j E SSA r = = = − + −
从这个结果我们可以看出 (1)SSE只与随机误差有关我们称之为误差平方和 SSE 且 为σ2的无偏估计 (2)SSA不仅与随机误差有关而且与A的各水平的差异有 关我们称之为由A因子引起的离差平方和,SSA越大,A的 各水平的差异也越大,因此,可用它来检验H0是香成立在HO 成立的条件下, E(SS4)=(r-1)a2 (3)我们还可以证明 SSE SSa x(N-r);在H为真时2~x2(r-1) 并且SSE与SSA相互独立
从这个结果,我们可以看出 (1)SSE只与随机误差有关,我们称之为误差平方和 (2) SSA不仅与随机误差有关,而且与A的各水平的差异有 关,我们称之为由A因子引起的离差平方和, SSA越大, A的 各水平的差异也越大,因此,可用它来检验H0是否成立.在H0 成立的条件下, (3)我们还可以证明 2 2 ˆ SSE N r = − 且 为 的无偏估计 E SSA ( ) 2 =(r-1) 2 2 2 2 ( ); ( 1) SSE SSA N r r − − 在 0 H 为真时 并且SSE与SSA相互独立
由上面讨论,我们找到了一种检验H0的方法 选取统计量 F SSA/(r-1) 在H0为真时F~F(r-1,N SSE/(N-r 拒绝域为 W={F>F(r-1,N-r)}
由上面讨论,我们找到了一种检验H0的方法: 选取统计量 拒绝域为 ( 1) 0 ( 1, ) ( ) SSA r F H F F r N r SSE N r − = − − − 在 为真时 W F F r N r { ( 1, )} = − −
例:某灯泡厂用四种不同配料方案制成的灯丝生产了四批 灯泡在每批灯泡中取若干个做寿命试验它们的寿命如下 口口 种 寿命(小时 1600.1610.1650.1680.1700.1720.1800 1580.1640.1640.1700.1750 1460,1550,1600,1620,1660,1740,1820,1640 1510.1520.1530.1570.1600.1680 解:见教材P90
例:某灯泡厂用四种不同配料方案制成的灯丝生产了四批 灯泡,在每批灯泡中取若干个做寿命试验,它们的寿命如下: 解:见教材P90. 品种 寿命(小时) 1600,1610,1650,1680,1700,1720,1800 1580,1640,1640,1700,1750 1460,1550,1600,1620,1660,1740,1820,1640 1510,1520,1530,1570,1600,1680 A1 A2 A3 A4