基础兽医学研究方法 操老师—一试验设计与统计分析(基础兽医学部研究生学位课)16学时 第一节生物统计与试验设计基础 生物统计学的原理能指导我们在从事科学研究中,从被动走向主动,从盲目走向理智,用最小的工作量完 成科学研究,并使研究结果正确可靠。 一、试验结果的表达方法及有效数字的确定 在表达科学数据结果时,既要把握数据的准确度,又要把握其精确度(准确度表示按近事物真值的程度 精确度,观测值彼此接近的程度)在科学实验中,总是在保证准确度的条件下,来提高精确度。有时不注意事物 的准确性,而过于考虑其精确性是无意义的,甚至是不客观的,要出笑话的 平均数有效数安的确定: 原则:平均数的有效位数的确定(有效位数取决于样本的变差)。原则根据1/3标准差的第一位而定。 如:36152±920.8g1/3S=920.8/3=3069g。第一位是0.3kg平均 因此:36152±920.8g-36±0.9kg 例:36152+210.3g1/3S=0.0701kg→3.62±0.21kg 二、随机变量的数字特征 1、数学期望 为了描述某一组事物的大致情况,实践中经常使用平均值这个概念。 数学期望的定义:随机变量ξ能取各个值,以取这些值的概率为加权数的加权平均来计量随机变量ξ平均 取值,则称这种平均值为随机变量ξ的数学期望,用E(ξ)表示。 例:设ξ为离散型随机变量,它们的分布密度用表格表示为 概率|P1 则规定的数学期望E(5)为:E(5)=ZaP 对于ξ的函数f()的数学期望的定义 如果:zf(a1)p绝对收敛,则 EF(5)=(a1)p1其中P=P{E=a}(=12,…) 设ξ为连续型随机变量,它的分布密度为f(x),规定ξ的数学期望Eξ为: Es= co xf(x)d 方差与标准差 随机变量的特征除了数学期望外,还有方差与标准差。方差和标准差是反应随机变量各变数变异与离数程 度大小的一个指标。 方差和标准差就是用来反映随机变量ξ的离散程度大小的一个特征值。 在数理统计中,通常用(ξ-Eξ)2来计量ξ与Eξ的偏差,这里取平方的目的是避免正负偏差相互抵消情 况(离均差和为零) 如 4 其均值为X=3:则Σ(X1-X)=(1-3)+(2-3)+(3-3)+ ∑(-E5)(4-3)+(5-3)=0 在概率论中通常用(5-E5)2的数学期望定义为方差,用σ2()表示,即规定 )=E(ξ-Eξ 根据数学期望的性质,由于E(ξ)是一个常数,因此 02(5)=(5E)2=E[22(E)+(E5)2 =E2-2(E5)(E)+(E5)2 =E52-(E5)2 根据连续型随机变量的数学期望公式E5=∫=(x
1 基础兽医学研究方法 操老师——试验设计与统计分析(基础兽医学部研究生学位课) 16 学时 第一节 生物统计与试验设计基础 生物统计学的原理能指导我们在从事科学研究中,从被动走向主动,从盲目走向理智,用最小的工作量完 成科学研究,并使研究结果正确可靠。 一、试验结果的表达方法及有效数字的确定 0.034m≠3.40cm 在表达科学数据结果时,既要把握数据的准确度,又要把握其精确度(准确度表示按近事物真值的程度, 精确度,观测值彼此接近的程度)在科学实验中,总是在保证准确度的条件下,来提高精确度。有时不注意事物 的准确性,而过于考虑其精确性是无意义的,甚至是不客观的,要出笑话的。 平均数有效数安的确定: 原则:平均数的有效位数的确定(有效位数取决于样本的变差)。原则根据 1/3 标准差的第一位而定。 如:3615.2±920.8g 1/3S=920.8/3=306.9g。第一位是 0.3kg 平均: 因此:3615.2±920.8g→3.6±0.9kg 例:3615.2+210.3g 1/3S=0.0701kg →3.62±0.21kg 二、随机变量的数字特征 1、数学期望 为了描述某一组事物的大致情况,实践中经常使用平均值这个概念。 数学期望的定义:随机变量ξ能取各个值,以取这些值的概率为加权数的加权平均来计量随机变量ξ平均 取值,则称这种平均值为随机变量ξ的数学期望,用 E(ξ)表示。 例:设ξ为离散型随机变量,它们的分布密度用表格表示为: ξ a1 a2 … ai … 概率 P1 P2 … Pi … 则规定的数学期望 E(ξ)为:E(ξ)= Zai pi 对于ξ的函数 f(ξ)的数学期望的定义: 如果: ai pi Zf ( ) 绝对收敛,则 EF(ξ)= ai pi Zf ( ) 其中 Pi=P{ξ=ai} (I=1.2,…) 设ξ为连续型随机变量,它的分布密度为 f(x),规定ξ的数学期望 Eξ为: E xf (x)dx = − 2、方差与标准差: 随机变量的特征除了数学期望外,还有方差与标准差。方差和标准差是反应随机变量各变数变异与离数程 度大小的一个指标。 方差和标准差就是用来反映随机变量ξ的离散程度大小的一个特征值。 在数理统计中,通常用(ξ-Eξ)2 来计量ξ与 Eξ的偏差,这里取平方的目的是避免正负偏差相互抵消情 况(离均差和为零) 如 1. 2. 3. 5. 4. 其均值为 X =3;则∑(Xi- X )=(1-3)+(2-3)+(3-3)+ ∑(ξ-Eξ) (4-3)+(5-3)=0 在概率论中通常用(ξ-Eξ)2 的数学期望定义为方差,用σ2(ξ)表示,即规定 σ2(ξ)=E(ξ-Eξ)2 根据数学期望的性质,由于 E(ξ)是一个常数,因此 σ2(ξ)=E(ξ-Eξ)2=E[ξ2 -2(Eξ)ξ+(Eξ)2 ] =Eξ2 -2(Eξ)(Eξ)+(Eξ)2 =Eξ2 -(Eξ)2 根据连续型随机变量的数学期望公式 E xf (x)dx = −
可知:2(5)=E(-)2=∫ -1D)-(x-)212a2d x-A 则 02(5)=re"ndt 2丌= 证明:任何随机变量经标准化转换后,数学期为0,方差与标准差恒为1 、实验研究中,可疑数据的取舍方法 在科学实验中,有时发现试验结果中某些数值特高或特低,异常高或异常低,我们称之为可疑值。可疑值的 取舍,除了根据专业知识决定取舍外,还可依据统计学原理(标准差特性)进行取舍,其方法如下 服从正态分布的随机变量,根据正态分布函数(概率密度函数)可知 P(X-10≤X≤X+10)=68.27% P(X-20≤X≤X+2o)=9545% P(X-30≤X≤X+30)=99.73% P(X-40≤X≤X+40)=9993% 第一步:首先计算出变数(不包括可疑值在内)在X±S 第二步:取舍原则 1、可疑值X在X±3S范围之内,X1来自抽样误差,尽管异常不应舍去; 2、可疑值X在X±3S范围之外,X出现的机率小于千分之三(100%-9973%),可结合专业知识决定取舍 3、可疑值Ⅹ在X1±4S范围之外,X1出现的机率小于十万分之七,(100%-99993%),应舍去 例:某一试验结果的X±S为2.5±04,现有一数据为42,在25±4×04范围(09~41)之外,出现的 机率小于十万分之七,应舍出。 第二节医学统计学显著性检验 、显著性检验的分类 显著性检验可分为参数检验与非参数检验两大类最常用的参数检验包括三大检验 1、t检验(Thet-test):检验的资料类型包括计量资料与计数资料(百分数差异检验) a.总体均数与样本均数b.非配对t检验c.配对t检验 d.总体百分数与样本百分数检验e.两样本百分数检验 共同特点是检验两组均数的差异性,两两比较 检验结果的描述P>0.05P≤0.05P≤001P>0.01 P≤0.05(即0.010.05) 表面效应由随机误差引起的概率大于5%; 2、卡方检验( The chi- squared test) a.检验资料类型为计数资料 b分独立性检验和适合性检验 c.可进行两两比较,也可进行多重比较(卡方分割) 3、方差分析( The variance analysis a.检验资料类型多为计量资料; b.分为单因素双因素与多因素方差分析 2
2 2 2 2 2 / 2 2 2 ( ) / 2 2 2 2 2 2 [ ] } 2 2 ( ) 2 ( ) : ( ) ( ) 2 2 2 2 2 2 2 = = = − + = − = − = − = + − − + − − − − − − − t e e dt t e dt x t e x E t t t x d x 令 则 可知 证明:任何随机变量经标准化转换后,数学期为 0,方差与标准差恒为 1。 三、实验研究中,可疑数据的取舍方法 在科学实验中,有时发现试验结果中某些数值特高或特低,异常高或异常低,我们称之为可疑值。可疑值的 取舍,除了根据专业知识决定取舍外,还可依据统计学原理(标准差特性)进行取舍,其方法如下: 服从正态分布的随机变量,根据正态分布函数(概率密度函数)可知 P( X -1σ≤X≤ X +1σ)=68.27% P( X -2σ≤X≤ X +2σ)=95.45% P( X -3σ≤X≤ X +3σ)=99.73% P( X -4σ≤X≤ X +4σ)=99.993% 第一步:首先计算出变数(不包括可疑值在内)在 X ±S 第二步:取舍原则 1、可疑值 X1 在 X ±3S 范围之内,X1 来自抽样误差,尽管异常不应舍去; 2、可疑值 X1 在 X ±3S 范围之外,X1 出现的机率小于千分之三(100%-99.73%),可结合专业知识决定取舍; 3、可疑值 X1 在 X1±4S 范围之外,X1 出现的机率小于十万分之七,(100%-99.993%),应舍去。 例:某一试验结果的 X ±S 为 2.5±0.4,现有一数据为 4.2,在 2.5±4×0.4 范围(0.9~4.1)之外,出现的 机率小于十万分之七,应舍出。 第二节 医学统计学显著性检验 一、显著性检验的分类 显著性检验可分为参数检验与非参数检验两大类最常用的参数检验包括三大检验 1、 t 检验(The t-test):检验的资料类型包括计量资料与计数资料(百分数差异检验) a. 总体均数与样本均数 b. 非配对 t 检验 c. 配对 t 检验 d. 总体百分数与样本百分数检验 e. 两样本百分数检验 共同特点是检验两组均数的差异性,两两比较 检验结果的描述 P>0.05 P≤0.05 P≤0.01 P>0.01 P≤0.05(即 0.01<P<0.05) 过去统计结论用“差异显著,非常显著或不显著”的说法,含意不够确认,更不能使用诸如“两组均数相差 差别很大,非常大或不大”。 现在正规标准表达统计学结论应该如下:差别(异)有显著意义(P<0.05)表面效应由随机误差引起的概率小 于 5%;差别(异)有显著意义(P<0.01)表面效应由随机误差引起的概率小于 1%;差别(异)无显著意义(P>0.05) 表面效应由随机误差引起的概率大于 5%; 2、卡方检验(The chi-squared test) a. 检验资料类型为计数资料; b. 分独立性检验和适合性检验; c. 可进行两两比较,也可进行多重比较(卡方分割) 3、方差分析(The variance analysis) a. 检验资料类型多为计量资料; b. 分为单因素双因素与多因素方差分析;
c.平均数多重比较分析(多重比较要求用邓肯( Duncan氏)氏新复极差检验) 显著性检验之间的关系 t检验与方差分析:方差分析是t检验的扩大,t检验是方差分析的特殊形式t检验是进行两两比较,方差分 析是进行多组均值分析比较 a.解决均数K为2个差异显著性检验-t检验:解决均数大于2个以上的差异性检验即K>2,只能用方差分 析;在K>2时,即有K个时就有K-D个差异性,如K=2有一个差异性一x 如K=3有三个差异性X1-X2X1-X3Xx2Xx3,如K=7则有×7×(71)=21个差异性 b.t检验只能由2(n-1)自由度估计(假设n1=n≥=n),而不能以K(n-1)个自由度估计:要用t检验方法来 代替方差分析多重比较,误差估计的精确度降低 X1X2X3比较可以用t检验完成,但? .t检验两两检验的方法会随均数个数K的增大而加大增加犯I型错误的概率,(以a=005水平作显著性检 如在用t检验检验两组均数的差异性时,获得正确结论的概率是(1-a)=0.95,1代表一个差异 但对5个差异的比较用t检验,则获得正确结论的概率只是(1-a)=0.95=0.77 即5个比较中至少作出一个错误结论的概率为10.77=023 2、t检验与X2检验 检验的资料类型为计量资料,其理论分布属于正态分布类型。 但在样本百分数检验时,资料为次数资料。n充分大时,其二次分布逐渐逼迫正态分布,即在n充分大时 计数百分资料可以用t检验中的两样本百分数差异显著性检验进行统计分析,也即计数资料卡方检验,在样本数 充分大时(120左右)可用t检验代替:但样本含量较小的计数资料不得使用t检验,只能使用ⅹ检验 由于样本数较大(计数资料)因此可使用t检验: 、有关百分率效应差异比较分析试验设计(样本含量确定) 某次药效试验研究,甲药组10人,治愈6人,乙药组10人,治愈3人,试比较两药的疗效 a统计分析方法的选定,由于样本数较小,不能选用两个百分数差异显著性检验中的t检验,只能选用计 数资料Ⅹ2检验中的独立性检验,Ⅹ2×2表检验法 b.统计分析 药物 治愈 未愈 甲乙Z 3 7 10 11 x2=(6×7-3×4)-202×20 10×10×9×11 0.8080 X2=08080(384故P)005,甲乙两药效疗差异无显著意义(P)005) c.统计结果分析:检验结果表明,虽然甲药痊愈率为60%,乙药30%,但统计结果表明:两药疗效一致。 试验设计与统计检验出了什么问题:①统计分析无误;②试验设计有误(样本数太少,不能说明问题):③解决 问题办法,扩大试验样本数 第三节回归分析方法 利用最小二乘法原理,我们很容易找到直线方程y=bx+a系数ba的表达式: b ∑Xy2-XEyn a=y+bx ∑X2-(X)2/n 、加权回归分析法( Analysis of Weighted Regression) 一般回归分析是指自变量和因变量都没有重复的回归分析,自变量和因变量是一一对应的。权重等于1的 回归,如果各组因变量有不同的方差,即S1,S2,S3…Sk间差异有显著意义,这时每组因变量平均有权重 Wi=n/S2,即权重与重复次数成正比,与样本方差S2成反比,加权直线回归分析同样可利用最小二乘法( Methad
3 c. 平均数多重比较分析(多重比较要求用邓肯(Duncan 氏)氏新复极差检验)。 二、显著性检验之间的关系 1、t 检验与方差分析:方差分析是 t 检验的扩大,t 检验是方差分析的特殊形式, t 检验是进行两两比较,方差分 析是进行多组均值分析比较。 a. 解决均数 K 为 2 个差异显著性检验- t 检验;解决均数大于 2 个以上的差异性检验即 K>2,只能用方差分 析;在 K>2 时,即有 K 个 X 时就有 ( 1) 2 1 K K − 个差异性, 如 K=2 有一个差异性 X1 − X2 , 如 K=3 有三个差异性 X1 − X2 X1 − X3 X2-X3 , 如 K=7 则有 2 1 ×7×(7-1)=21 个差异性 b. t 检验只能由 2(n-1)自由度估计(假设 n1=n2=n),而不能以 K(n-1)个自由度估计:要用 t 检验方法来 代替方差分析多重比较,误差估计的精确度降低。 X1 X2 X3 比较可以用 t 检验完成,但? c. t 检验两两检验的方法会随均数个数 K 的增大而加大增加犯Ⅰ型错误的概率,(以 a=0.05 水平作显著性检 验) 如在用 t 检验检验两组均数的差异性时,获得正确结论的概率是(1-a)=0.95, 1 代表一个差异 但对 5 个差异的比较用 t 检验,则获得正确结论的概率只是(1-a)=0.955=0.77 即 5 个比较中至少作出一个错误结论的概率为 1-0.77=0.23 2、t 检验与 X2 检验 t 检验的资料类型为计量资料,其理论分布属于正态分布类型。 但在样本百分数检验时,资料为次数资料。n 充分大时,其二次分布逐渐逼迫正态分布,即在 n 充分大时, 计数百分资料可以用 t 检验中的两样本百分数差异显著性检验进行统计分析,也即计数资料卡方检验,在样本数 充分大时(120 左右)可用 t 检验代替;但样本含量较小的计数资料不得使用 t 检验,只能使用 X2 检验。 由于样本数较大(计数资料)因此可使用 t 检验: 三、有关百分率效应差异比较分析试验设计(样本含量确定) 某次药效试验研究,甲药组 10 人,治愈 6 人,乙药组 10 人,治愈 3 人,试比较两药的疗效。 a. 统计分析方法的选定, 由于样本数较小,不能选用两个百分数差异显著性检验中的 t 检验,只能选用计 数资料 X2 检验中的独立性检验,X2 2×2 表检验法。 b. 统计分析 药物 治愈 未愈 Z 甲 6 4 10 乙 3 7 10 Z 9 11 N=20 0.8080 3.84 0.05, ( 0.05) 0.8080 10 10 9 11 [(6 7 3 4) 20 / 2] 20 2 2 2 = = − − = X P P X 故 甲乙两药效疗差异无显著意义 c. 统计结果分析:检验结果表明,虽然甲药痊愈率为 60%,乙药 30%,但统计结果表明:两药疗效一致。 试验设计与统计检验出了什么问题:①统计分析无误;②试验设计有误(样本数太少,不能说明问题);③解决 问题办法,扩大试验样本数。 第三节 回归分析方法 利用最小二乘法原理,我们很容易找到直线方程 y=bx+a 系数 b,a 的表达式: a Y bx X Xi n X y X y n b i i i i i = + − − = ( ) / / 2 2 一、加权回归分析法(Analysis of Weighted Regression) 一般回归分析是指自变量和因变量都没有重复的回归分析,自变量和因变量是一一对应的。权重等于 1 的 回归,如果各组因变量有不同的方差,即 2 2 3 2 2 2 1 , , S S S SK 间差异有显著意义,这时每组因变量平均有权重 Wi=n1/Si 2 ,即权重与重复次数成正比,与样本方差 Si 2 成反比,加权直线回归分析同样可利用最小二乘法(Methad
of least squares)使 ΣWi[y-(bxi+a)]=mn 分别对b和a求一阶导数,然后令导数函数为零,解出方程解b和a的表达式: ∑xy-∑x∑y/∑1 2-(∑x)2/ w1=n/S X=∑x/W, y/∑1 二、医学上常用曲线的拟合方法 1、量反应的直接变换——倒数变换法( Reciprocal transformation) 我们知道单位体积的酶催化反应速度V与底物浓度[S]的关系为 S+Km 即著名的米氏方程(双M方程: Michaelis-Menten方程) 米氏方程的重要性: 1、酶促反应动力学过程 2、药物受体作用动力学过程; 3、非线性药物动力学过程; Vm s S]+knV酶促反应速度,vm理论最大反应速度:S底物浓度,Km米氏常数 b.E=叫 e【4+faEm受体最大内在活性:E效应:A]药物浓度,KA受体配体结合解离常数 药物在体内的变化速率,Vm最大理论速度:X某部位的药量:Km达到最大消除 dt K+x dt 速度一半时的药物浓度。 Km:单位体积中酶促反应速度达到最大反应速度一半时的底物浓度。 证明 =时 只有当Kn=[S] 2 [S]+K 等式成立 =rmS这一个双曲线方程不可能直接进行直线回归分析而求出F和K。 但可进行直线化。 Lineweaver Burk直线化 1[S]+K K V VMaxs vmax y b 则方程变成y=bx+a直线方程 回归分析时,以表示纵轴,表示横轴,于是直线在纵轴上的截距为。,斜率为%,这样根据 V和S]可求出 Michaelis常数Km和最大反应速度。 2、 logistic生长曲线 logistic生长曲线原系比利时数学家 PF Verhult于1838年推导出来的,但长期被淹没,直到上世纪20年代 才被 P Pearl和 L.J. Reed重新发现,目前已广泛应用于动植物的饲养,栽培、资源、生态、环境等方面的模拟硏 究。其特点是开始增长缓慢,而在以后的某一范围内迅速增长,达到某限度后,增长又缓慢下来,曲线略呈拉长 的“S"。因此,也叫S型曲线。 Logistic生长曲线方程为
4 of least squares)使 [ ( )] min 2 Wi yi − bxi + a = 分别对 b 和 a 求一阶导数,然后令导数函数为零,解出方程解 b 和 a 的表达式: a Y bx wi n s X wx w Y wy w wx wx w wxy wx wy w b i i = − = = = − − = / / ; / ( ) / / 2 2 2 二、医学上常用曲线的拟合方法 1、量反应的直接变换——倒数变换法(Reciprocal transformation) 我们知道单位体积的酶催化反应速度 V 与底物浓度[S]的关系为 S Km V S V + = [ ] [ ] max 即著名的米氏方程(双 M 方程:Michaelis-Menten 方程) 米氏方程的重要性: 1、酶促反应动力学过程; 2、药物受体作用动力学过程; 3、非线性药物动力学过程; a. S Km V S V + = [ ] [ ] max V 酶促反应速度,Vmax 理论最大反应速度;[S]底物浓度,Km 米氏常数。 b. A KA a A E + = [ ] [ ] a=Emax 受体最大内在活性;E 效应;[A]药物浓度,KA 受体配体结合解离常数。 c. dt dx K X V X dt dx m m + = 药物在体内的变化速率,Vm 最大理论速度;X 某部位的药量;Km达到最大消除 速度一半时的药物浓度。 Km:单位体积中酶促反应速度达到最大反应速度一半时的底物浓度。 证明: max时 2 1 V = V m m m m m V K S K V S V K S S K S S K V S V 这一个双曲线方程 不可能直接进行直线回归分析 而求出 和 等式成立 只有当 max max max max , , [ ] [ ] [ ] [ ] [ ] 2 1 [ ] [ ] 2 1 + = = + = + = 但可进行直线化。 Lineweaver Burk 直线化 X S b V K a V y V V S K V S V S K V m m MAX m = = = = = + + = [ ] 1 ; ; 1 1 [ ] 1 max 1 [ ] 1 [ ] max max max 令 ; 则方程变成 y=bx+a 直线方程 回归分析时,以 V 1 表示纵轴, [ ] 1 S 表示横轴,于是直线在纵轴上的截距为 max 1 V ,斜率为 Vmax Km ,这样根据 V 和[S]可求出 Michaelis 常数 Km和最大反应速度。 2、logistic 生长曲线 logistic 生长曲线原系比利时数学家 P.F.Verhult 于 1838 年推导出来的,但长期被淹没,直到上世纪 20 年代 才被 P.Pearl 和 L.J.Reed 重新发现,目前已广泛应用于动植物的饲养,栽培、资源、生态、环境等方面的模拟研 究。其特点是开始增长缓慢,而在以后的某一范围内迅速增长,达到某限度后,增长又缓慢下来,曲线略呈拉长 的“S”。因此,也叫 S 型曲线。Logistic 生长曲线方程为
K 直线化移项后得到 y(+ae) =k ae=K-y/y 两边取自然数后得到h(k-y)=ha-bx, 令h(k-y)=y,血a=a,-b=b 则y=a+bx 因此,可将每一y观测值转换为y,用y2与x进行直线回归分析即可求出a和b,b=-ba=e 在转换时,必须先确定K值,K值的确定方法有两种 (1)如果y是累积频率,y无限增大的终极量为100%,显然k=100 (2)当y是生长量或繁殖量时,可取3对等间距观测值(x1,y),(x,y2)和(x3,y3),并将其代入式 得到联立方程得 =ae -o =a y3 令X2=x+可得到 K=y2(y1+y3)-2yy2y3/y2-yy3 3、半数效量及其求解方法 半数效量包括LD50、ED50等 半数致死量( Median lethal dose)即给群体动物用药后,使半数动物死亡的剂量,是反映毒物(药物)的急 性毒性的指标。半数效量(质反应的敏感性)的敏感性作为生物质反应率的一个常用指标 一般的生物反应曲线为S型曲线,位于“S”曲线中间段Y对X的变化较快一一较敏感。所以取质的半数 反应量 在取对数剂量条件下,对反应率进行变换(机率变换 Probit变换)使S曲线变为一直线进行回归后即可找 出50%反应率的剂量值一一曲线配合法。 另外一大类方法是插值法:最常见的插值法有:a最大或然性法( bliss法) b.克贝尔法( Karber法,寇氏法) 为了启发研究者的思维,让我们看看前人是怎样着手研究,寻找出LDo的改良寇氏法(常用方法)的计算
5 ln( ) ln , / (1 ) 1 a bx y k y ae K y y y ae K ae y k y ae K y bx bx bx bx = − − = − + = = − + = − − − − 两边取自然数后得到 直线化移项后得到 y a b x y a a b b y k y ' ' ' ln( ) ', ln ', ' = + = = − = − 则 令 因此,可将每一 y 观测值转换为 y’,用 y’与 x 进行直线回归分析即可求出 a’和 b’,b=-b’ a=ea’ 在转换时,必须先确定 K 值,K 值的确定方法有两种; (1)如果 y 是累积频率,y 无限增大的终极量为 100%,显然 k=100; (2)当 y 是生长量或繁殖量时,可取 3 对等间距观测值(x1, y1),(x2, y2)和(x3, y3),并将其代入式 1 3 2 1 3 1 2 3 2 2 2 1 3 2 3 3 2 2 1 1 ( ) 2 / 2 3 2 1 K y y y y y y y y y x x X ae y k y ae y k y ae y k y ae y k y bx bx bx bx = + − − + = = − = − = − = − − − − − 令 可得到 得到联立方程得 3、半数效量及其求解方法 半数效量包括 LD50 、ED50 等 半数致死量(Median lethal dose)即给群体动物用药后,使半数动物死亡的剂量,是反映毒物(药物)的急 性毒性的指标。半数效量(质反应的敏感性)的敏感性作为生物质反应率的一个常用指标。 一般的生物反应曲线为 S 型曲线,位于“S”曲线中间段 Y 对 X 的变化较快——较敏感。所以取质的半数 反应量。 在取对数剂量条件下,对反应率进行变换(机率变换 Probit 变换)使 S 曲线变为一直线进行回归后即可找 出 50%反应率的剂量值——曲线配合法。 另外一大类方法是插值法:最常见的插值法有:a. 最大或然性法(Bliss 法) b. 克贝尔法(Karber 法,寇氏法) 为了启发研究者的思维,让我们看看前人是怎样着手研究,寻找出 LD50 的改良寇氏法(常用方法)的计算 5 0 10 0 0 LD 50 对 数 剂量
公式,从而更深刻地理解利用寇氏法计算LDo的试验条件与试验设计要求 当横坐标为对数剂量,其差值均为i,纵坐标为死亡百分率,组内动物数相等时, 曲线呈对称形。 Pm X 在图1中可见Xk剂量BF线的左下侧小三角形面积△EDF相当于用Xk剂量时动物总效应能致死的动物数, 该线右上侧三角形△BCD相当于在该剂量条件下,应能耐受动物数,如这两部分面积相等,则Xk应为X50 (logLD5o) X50值可用OF长度表示,由于OA长度为1(百分百死亡率),因此X50也可用OF×1=OF×OA即口 OABF的面积来表达。该面积等于口OACG减去口FBCG的面积,当△EDF=△BCD时则有: X50=□OACG-□FBCG=OACG-△ECG (1)口OACG=OA×OG=1×Xm=Xm(最大死亡率对数剂量)100% (2)△ECG面积是各直方条面积之和减去各小三角形面积之和 直方图条之底均为i(对数剂量剂间比),高为各死亡百分率P1、P2…Pm,直方图条面积总和为∑iPi=iPi, 各小三角形之底为i,可移到图右边规堆积起来,可以看出,各小三角形面积总和实际为OA×i的一半,也即0.5i。 即△ECG=EP-0.5i 因此X50=口OACG-△ECG= Xm-i>Pi-0.5i Xmi(∑Pi-0.5) X50为半数致死量的对数剂量,所以 Dso-log[Xmi(∑P-0.5) 通过对寇氏法计算LD50的公式推算,在进行LD50试验设计时应注意的事项: 1、应按等比级数确定各组剂量,对数剂量的剂间差恒为 2、LDo试验设计时注意在LD50左右两边的剂量组基本相等; 3、要求设计出0%的死亡剂量组和100%的死亡剂量组 4、小剂量一端有重复的0%死亡率或大剂量一端有重复的100%死亡率应弃去重复死亡率的极端剂量,例如 X1、X2对应的死亡率为P=P2=0,则应弃去剂量X1:同理如果Xk4,Xk对应的死亡率P1=P=100%,则应充去Xk 剂量 5、当小剂量一端P1≠0而是大于0或大剂量一端Pk≠1而是<1,若试验者有把握认为向下增加一个小 级的剂量X0会有P=0,或增大一个大剂量Xk+会有R+1=1,则原试验结果仍符合寇氏法计算公式的要求(本身 要求P1=0,Pm=1) 证明:增加小剂量X0有Po LDo=bog[Xn-(ΣP-0.5 =log [ Xm-i(P+P-.P-0.5) 同样证明增加一个剂量Xk+有PK+1=1,也不影响公式 LD50=log[xm-1(P-0.5) 证增加一个大剂量Xk+有Pk+1=1
6 公式,从而更深刻地理解利用寇氏法计算 LD50 的试验条件与试验设计要求。 当横坐标为对数剂量,其差值均为 i,纵坐标为死亡百分率,组内动物数相等时,S 型曲线呈对称形。 在图 1 中可见 Xk 剂量 BF 线的左下侧小三角形面积△EDF 相当于用 Xk 剂量时动物总效应能致死的动物数, 该线右上侧三角形△BCD 相当于在该剂量条件下,应能耐受动物数,如这两部分面积相等,则 Xk 应为 X50 (logLD50). X50 值可用 OF 长度表示,由于 OA 长度为 1(百分百死亡率),因此 X50 也可用 OF 1 = OF OA 即□ OABF 的面积来表达。该面积等于□OACG 减去□FBCG 的面积,当△EDF=△BCD 时则有: X50=□OACG-□FBCG=□OACG-△ECG (1)□OACG= OA OG = 1 X m = X m (最大死亡率对数剂量)100% (2)△ECG 面积是各直方条面积之和减去各小三角形面积之和。 直方图条之底均为 i(对数剂量剂间比),高为各死亡百分率 P1、P2…Pm,直方图条面积总和为 iPi = iPi , 各小三角形之底为 i,可移到图右边规堆积起来,可以看出,各小三角形面积总和实际为 OA i 的一半,也即 0.5i 。 即 △ECG= iP −0.5i 因此 X50=□OACG-△ECG=Xm- iPi −0.5i = Xm- i(Pi − 0.5) X50 为半数致死量的对数剂量,所以 LD50=log-1 [Xm- i(Pi − 0.5) ] 通过对寇氏法计算 LD50 的公式推算,在进行 LD50 试验设计时应注意的事项: 1、应按等比级数确定各组剂量,对数剂量的剂间差恒为 i; 2、LD50 试验设计时注意在 LD50 左右两边的剂量组基本相等; 3、要求设计出 0%的死亡剂量组和 100%的死亡剂量组; 4、小剂量一端有重复的 0%死亡率或大剂量一端有重复的 100%死亡率应弃去重复死亡率的极端剂量,例如 X1、X2 对应的死亡率为 P1=P2=0,则应弃去剂量 X1;同理如果 Xk-1,Xk 对应的死亡率 Pk-1=Pk=100%, 则应充去 Xk 剂量。 5、当小剂量一端 P1≠0 而是大于 0 或大剂量一端 PK≠1 而是<1,若试验者有把握认为向下增加一个小一 级的剂量 X0 会有 P0=0,或增大一个大剂量 Xk+1 会有 Pk+1=1,则原试验结果仍符合寇氏法计算公式的要求(本身 要求 P1=0,Pm=1) 证明:增加小剂量 X0 有 P0=0 log [ ( 0.5)] log [ ( 0.5)] log [ ( 0.5)] 1 0 1 1 1 50 = − − = − + − − = − − − − − X i P X i P P P LD X i P m m m m 同样证明增加一个剂量 XK+1 有 PK+1=1,也不影响公式 log [ ( 0.5)] 1 50 = − − − LD X m i P 证 增加一个大剂量 XK+1 有 PK+1=1
则LD50=bg-[Xn-i(ΣP-0.5) B+P-…Pn og"[Xm+i-i(P+P2+.Pm+ Pm+1-0.5)] =log[Xn+i-(P+P2+…P ) log"[X i(+P2+…Pm-0.5) =log[Xn-i(∑P-0.5) 6、当小剂量一端P>0或大剂量一端Pk∞ x50+S P-∑P n-1 toos=1. 9 D(mg/kg) X50=-0.19-(0.07(3.2-0.5) 0.54100 0.379 0.471020.20.04 0.400.4010 0.40.16 LD30=lg(-0.379)=0418mg/kg 0.33108 0.55 0.261080.80.64 S0=007√(32-248)/9=0.0198 0.1910101.01.00 ∑3.2∑248 95%可信限 ∑P-∑P S log(X50±196S5)=bg[-0.379±196×00198] =0382~0.45mg/kg 第四节试验设计 Fisher提出的现代科学试验设计三大基本原则“随机、对照、重复”。在此基础了又提出了试验设计“四性” (4R3原则) 1、受试对象的代表性 Representativeness(样本质量); 2、试验的可重复性 Replications试验结果经得起重复检查 3、试验的随机性 Randomizations随机抽样,随机分组,随机处理 4、试验设计的合理性 Rationality符合专业要求,又符合统计学原则,切合实际,方便易行。(上月亮,建 个很长很长的梯子,理论上似乎是可以,但不易实际操作。) “芝麻定律”说明试验设计的重要性 常见实验设计的类型: 完全随机设计( Completely randomized design) 配对试验设计( Paired design) 随机区组设计( Randomized block design) 交叉试验设计( Cross-over design) 拉丁方试验设计( Latin square design) 正交试验设计( Orthogonal design) 二交互作用又称为互作效应( Interaction) 主效应( Main effect。生物反就是复杂的,相互作用也是存在的。有处理必有效应,即试验因素对试验指 标的影响称为试验效应。如:温度增加(在一定范围内)动物的饮水量也增加,饲料中蛋白质含量增加,产蛋率
7 log [ ( 0.5)] log [ ( 0.5)] log [ ( 1 0.5)] log [ ( 0.5)] | log [ ( 0.5)] 1 1 2 1 1 2 1 1 1 2 1 1 1 2 1 50 = − − = + − − + + − = + − + + + − − + + + − + − = − − − − − + + − − X i P X i i i P P P X i i P P P X i P P P P P P P LD X i P m m m m m m m m m m 则 6、当小剂量一端 P>0 或大剂量一端 PK<1,当试验者认为即使再增加一级小剂量也不会使 P0=0 或增大一 级剂量也不会使 PK+1=1 时,则必须补充剂量 X0 或 XK+1,重新完成其补充试验。 两个 LD50 的显著性检验(t-检验) → − − + − − − = + − = df n P P i n P P i LD LD S S X X t X X 2 2 2 2 ' 5 0 5 0 2 '5 0 2 5 0 5 0 5 0 ' 1 ' ' 1 | ' | | log log | t0.01=2.58 t0.05=1.96 D(mg/kg) x n r p p 2 0.29 0.54 10 0 0 0 0.34 0.47 10 2 0.2 0.04 0.40 0.40 10 4 0.4 0.16 0.47 0.33 10 8 0.8 .064 0.55 0.26 10 8 0.8 0.64 0.64 0.19 10 10 1.0 1.00 ∑3.2 ∑2.48 95%可信限 mg k g X S n P P S i x x 0.382 ~ 0.45 / log ( 1.96 ) log [ 0.379 1.96 0.0198] 1 1 5 0 5 0 2 5 0 = = − − − = + − 第四节 试验设计 一.Fisher 提出的现代科学试验设计三大基本原则“随机、对照、重复”。在此基础了又提出了试验设计“四性” (4Rs 原则) 1、受试对象的代表性 Representativeness(样本质量); 2、试验的可重复性 Replications 试验结果经得起重复检查; 3、试验的随机性 Randomizations 随机抽样,随机分组,随机处理; 4、试验设计的合理性 Rationality 符合专业要求,又符合统计学原则,切合实际,方便易行。(上月亮,建 一个很长很长的梯子,理论上似乎是可以,但不易实际操作。) “芝麻定律”说明试验设计的重要性。 常见实验设计的类型: 完全随机设计(Completely randomized design) 配对试验设计(Paired design) 随机区组设计(Randomized block design) 交叉试验设计(Cross-over design) 拉丁方试验设计(Latin square design) 正交试验设计(Orthogonal design) 二.交互作用又称为互作效应(Interaction) 主效应(Main effect)。生物反就是复杂的,相互作用也是存在的。有处理必有效应,即试验因素对试验指 标的影响称为试验效应。如:温度增加(在一定范围内)动物的饮水量也增加,饲料中蛋白质含量增加,产蛋率 0.07 (3.2 248)/ 9 0.0198 log ( 0.379) 0.418 / 0.379 0.19 (0.07)(3.2 0.5) 50 1 50 50 = − = = − = = − = − − − − Sx LD mg k g X
增加。 效应又分为三种:简单效应,主效应(平均效应),互作效应( Simple effect)( Main effect)( Interaction)其 中前两种效应在一个试验中一般都能反应出来。 在这里举一个两因素两水平的试验为例加以说明,多因素多水平试验方法见有交互作用的正交表试验设计。 指标是某种子的发芽率 温度 湿度 饲养试验 药物相互作用药效试验等 B B b(40)ab(60) A2ab(50) ab(70) 简单效应:某因素同一水平条件下,另一因素不同水平效应的差值 B1水平的简单效应A2-A1=50-40=10 B2水平的简单效应A2-A1=70-60=10 A1水平的简单效应B2-B1=60-40=20 A2水平的简单效应B2-B1=70-50=20 主效应(平均效应)各因素简单效应的平均值 A因素主效应=(10+10)/2=10 B因素主效应=(20+20)/2=20 互作效应(交互作用),某一因素各水平下另一因素简单效应之差的均值。 本例A因素A1水平条件下,B因素的简单效应=B2-B1=60-40=20 A2水平条件下,B因素的简单效应=B2-B1=70-50=20 两简单效应差的均值(2-2)=0 即:所谓互作效应是两因素互共同作用对试验指标产生的协同或拮抗哪一部分效应。本试验的交互作用为零, 无互作,以图形表示。 00 判断标准: ①两条直线不相交,也不平行,正互作 ②两条直线互为交叉,负互作 ③两条直线互为平行,零互作 互作效应的实践意义 例如A、B两因素,A因素可使试验指标提高a% B因素可使试验指标提高b% 则无作用互作效应,A、B两因素可使试验指标提高(a+b)% 正互作效应时,A、B两因素同时处理可使试验指标 提高(a+b+△)%>(a+b)% 负互作效应时,A、B两因素同时处理可使试验指标 提高(a+b-△)%<(a+b)% 三.拉丁方试验设计 1.拉丁方的组成,因为它是由拉丁字母组成的正方形一拉丁方,其条件是,拉丁方内同一行或同一列内部
8 增加。 效应又分为三种:简单效应,主效应(平均效应),互作效应(Simple effect)(Main effect)(Interaction)其 中前两种效应在一个试验中一般都能反应出来。 在这里举一个两因素两水平的试验为例加以说明,多因素多水平试验方法见有交互作用的正交表试验设计。 指标是某种子的发芽率 饲养试验 药物相互作用药效试验等 简单效应:某因素同一水平条件下,另一因素不同水平效应的差值。 B1 水平的简单效应 A2-A1=50-40=10 B2 水平的简单效应 A2-A1=70-60=10 A1 水平的简单效应 B2-B1=60-40=20 A2 水平的简单效应 B2-B1=70-50=20 主效应(平均效应)各因素简单效应的平均值 A 因素主效应=(10+10)/2=10 B 因素主效应=(20+20)/2=20 互作效应(交互作用),某一因素各水平下另一因素简单效应之差的均值。 本例 A 因素 A1 水平条件下,B 因素的简单效应=B2-B1=60-40=20 A2 水平条件下,B 因素的简单效应=B2-B1=70-50=20 两简单效应差的均值 (2 2) 0 2 1 − = 即:所谓互作效应是两因素互共同作用对试验指标产生的协同或拮抗哪一部分效应。本试验的交互作用为零, 无互作,以图形表示。 判断标准: ①两条直线不相交,也不平行,正互作 ②两条直线互为交叉,负互作 ③两条直线互为平行,零互作 互作效应的实践意义: 例如 A、B 两因素,A 因素可使试验指标提高 a% B 因素可使试验指标提高 b% 则无作用互作效应,A、B 两因素可使试验指标提高(a+b)% 正互作效应时,A、B 两因素同时处理可使试验指标 提高(a+b+△)% >(a+b)% 负互作效应时,A、B 两因素同时处理可使试验指标 提高(a+b-△)% <(a+b)% 三. 拉丁方试验设计 1.拉丁方的组成,因为它是由拉丁字母组成的正方形—拉丁方,其条件是,拉丁方内同一行或同一列内部 温度 湿度 A1 a1b1(40) a1b2(60) A2 a2b1(50) a2b2(70) B1 B2 70 60 50 40 B1 B2 A2 A1
设有重复的字母。 例:4×4拉丁方 ABCD ABCD BADC BCDA CDBA CDAB DCAB DABC 2.要明确的是交叉设计属拉丁方设计的一个特例,最简单的拉丁方设计( Cross-over design) 交叉设计拉丁方AB2×2拉丁方 A 交叉设计用于比较在同一动物或器官上的重复观察 交叉设计的最大优点:处理是在同体上比较,从而避免了个体差异,分析动物间和顺序间的差异,必须用几 个重复的2×2拉丁方来分析 3.拉丁方设计试验的前提是根据在生物个体受到刺激可复原这一特征的基础上进行的 l·m 如:测定药物的生物利用度F AUCi B B B A 多组试验 n=8 B A B 动物1先品m后1y,3动物2,4先1:y,后.m。6 现在就是这个先后间隔的时间,动物在第一次注射后,可测出AUC,经过一定时间后,药物代谢排泄一血 液体内中的药浓下降至零,然后才能进行第二次用药 又例:要比较不同剂量的胰岛素对血糖降低的影响,由于给动物机体注射一定量的胰岛素后,可使血糖暂时 降低,经过一定时间后,动物体内的血糖又恢复正常一又可作为一个样本进行第二次处理。 但是有些情况下生物受刺激后则被看成(认为是)不可复原 例如要比较某种疫苗对体内抗体的增加作用 物接受疫苗→物→带有抗体的动物,且机体内的免疫机能激活状态不一样 无论经过多长时间,被看成是不是原来正常那种动物,因此不能用拉丁方设计试验。 4.拉丁方设计的优点 减少了个体差异所带来的误差 节约了动物数量 便于统计分析,得到信息丰富的统计结果 5.举例:试比较0.5、1.0、2.0、4.0 L U/Kg B w四种剂量的胰岛素对家兔血糖影响(例用拉丁方设计) 第一、选拉丁方表 4×4拉丁方表 第二,确定动物兔接受胰岛素后,恢复到正常状态所需的时间(>9天) 第三,确定拉丁方设计表(方案) 四种剂量胰岛素对象兔血糖影响的拉丁方设计表 注射日期 家兔编号 3.1 B D 3.10 B D C 3.20 D 其中A、B、C、D分别代表胰岛素的剂量0.5、1.0、2.0、40μkg,设计试验实施: 31号1号兔05μkg,2号兔1.0kg,3号兔20Hkg,4号兔40u/kg 3.10号1号兔1.0kg,2号兔05kg,3号兔40Jkg,4号兔20kg
9 设有重复的字母。 例:4×4 拉丁方 ABCD ABCD BADC BCDA CDBA CDAB DCAB DABC 2.要明确的是交叉设计属拉丁方设计的一个特例,最简单的拉丁方设计(Cross-over design) 交叉设计拉丁方 A B 2×2 拉丁方 B A 交叉设计用于比较在同一动物或器官上的重复观察。 交叉设计的最大优点:处理是在同体上比较,从而避免了个体差异,分析动物间和顺序间的差异,必须用几 个重复的 2×2 拉丁方来分析。 3.拉丁方设计试验的前提是根据在生物个体受到刺激可复原这一特征的基础上进行的, 如:测定药物的生物利用度 AUCi v AUCi m F = 动物 1 先 i m 后 i v ,动物 2,先 i v ,后 i m 。 现在就是这个先后间隔的时间,动物在第一次注射后,可测出 AUC,经过一定时间后,药物代谢排泄—血 液体内中的药浓下降至零,然后才能进行第二次用药。 又例:要比较不同剂量的胰岛素对血糖降低的影响,由于给动物机体注射一定量的胰岛素后,可使血糖暂时 降低,经过一定时间后,动物体内的血糖又恢复正常—又可作为一个样本进行第二次处理。 但是有些情况下生物受刺激后则被看成(认为是)不可复原。 例如要比较某种疫苗对体内抗体的增加作用 动物接受疫苗→动物→带有抗体的动物,且机体内的免疫机能激活状态不一样 ↓ 无论经过多长时间,被看成是不是原来正常那种动物,因此不能用拉丁方设计试验。 4.拉丁方设计的优点 减少了个体差异所带来的误差 节约了动物数量 便于统计分析,得到信息丰富的统计结果 5.举例:试比较 0.5、1.0、2.0、4.0 I.U/Kg B.W 四种剂量的胰岛素对家兔血糖影响(例用拉丁方设计) 第一、选拉丁方表 4×4 拉丁方表 第二,确定动物兔接受胰岛素后,恢复到正常状态所需的时间(>9 天) 第三,确定拉丁方设计表(方案) 四种剂量胰岛素对象兔血糖影响的拉丁方设计表 注射日期 家 兔 编 号 1 2 3 4 3.1 A1 B1 C1 D1 3.10 B2 A2 D2 C2 3.20 C3 D3 B3 A3 3.30 D4 C4 A4 B4 其中 A、B、C、D 分别代表胰岛素的剂量 0.5、1.0、2.0、4.0µ/kg,设计试验实施: 3.1 号 1 号兔 0.5µ/kg,2 号兔 1.0µ/kg,3 号兔 2.0µ/kg,4 号兔 4.0µ/kg 3.10 号 1 号兔 1.0µ/kg,2 号兔 0.5µ/kg,3 号兔 4.0µ/kg,4 号兔 2.0µ/kg A B 1 B A 2 B A 3 A B 4 A B 5 B A 6 B A 7 A B 8 多组试验 n=8
依次将试验进行完毕,得到数据 a4 a43 第四:拉丁方试验结果统计分析 本例可采用三因素多水平的统计分析一一方差分析 1.SS平方和(兔间平方和) df=4-1=3 MSR=SS/df 2.SS平方和(时间平方和)df=4-1=3MSt=SS/df 3.处理平方和(剂量间平方和)df=4-1=3MSd=SSdf 处理平方和计算,必须将结果表重新排列:(Hkg) 剂量 B 平均值a1+a1+a34+a43/4a12+a21+a3+a414a3+a4+a3n+a42/4a4+a3+a32+a41/4 误差平方和 SSe=SS总-SS横SS直-SS处 dfe=dfg-df横-dfg-df外=15-3-3-3=6 然后分别计算出各自的均方,进行F检验,如F检验无差异P>005,即可下统计学结论差异无显著性,如F 检验有差异,必须进行多种比较,再下结论。 F=MS《横,直、外) M df1=3 df2=6 四.正交试验设计( Orthogonal design) 科学研究中总是寻求较少的工作量获得较多的正确可靠的试验结果,其涉及到试验条件的筛选与优化问题。 为了考察较多的因素而不扩大试验规模,可使用正交试验设计,它是利用一套规格化的表格一一正交表来 安排试验,适用于多因素、多水平、试验误差较大,周期长等一类型的试验,是效率较高的一种试验方法,在确 定最佳反应试验条件,饲养效率最优化的饲料组方,联合用药复合制剂的最佳配方等多因素多水平的优化实验中 都需要采用这一试验设计。 现以实例说明正交试验设计的用途与试验设计方法与统计分析 某化工厂改革“潘生丁”环合反应旧工艺,其主要目的是想利用尿素与双乙烯酮来代替旧工艺中的硫脲及 乙酰醋酸乙酯,其指标是6-甲基脲嘧啶的收率。 分析,本试验目的主要考察三个主要反应条件 反应温度(A),反应时间(B)投料先分子比(C)尿素:双乙烯酮。现要找出这三个因素的最佳反应条件, 使收率最高 每个因素试验三个水平 A反应温度 A1=100℃ A2=110℃ A3=120℃ B反应时间 B1=6h B2=8h B3=10h C投料比 C1=l:1.2 C2=1:1.6 C=1:2.0 这是一个因素三水平的试验,现在通过正文试验的目的是找出这三个因素中,如何搭配其水平,才能获得 最高的6-甲基脲嘧啶的收率? 第一种作法:一一全面试验法,即对三个因素的所有水平的搭配进行全面试验,此时共有3=27次,具体 是 Cccc C C C
10 依次将试验进行完毕,得到数据 a11 a12 a13 a14 a21 a22 a23 a24 a31 a32 a33 a34 a41 a42 a43 a44 第四:拉丁方试验结果统计分析 本例可采用三因素多水平的统计分析——方差分析 1.SS 直平方和(兔间平方和) df=4-1=3 MSR=SS/df 2.SS 横平方和(时间平方和) df=4-1=3 MSt=SS/df 3.处理平方和(剂量间平方和) df=4-1=3 MSd=SS/df 处理平方和计算,必须将结果表重新排列:(µ/kg) 剂 量 A0.5 B1.0 C2.0 D4.0 平均值 a11+a22+a34+a43/4 a12+a21+a33+a44/4 a13+a24+a31+a42/4 a14+a23+a32+a41/4 4.误差平方和 SSe=SS 总-SS 横-SS 直-SS 处 dfe=df 总-df 横-df 直-df 外 =15-3-3-3=6 然后分别计算出各自的均方,进行 F 检验,如 F 检验无差异 P>0.05,即可下统计学结论差异无显著性,如 F 检验有差异,必须进行多种比较,再下结论。 F=MS(横、直、外)/Mse df1=3 df2=6 四. 正交试验设计(Orthogonal design) 科学研究中总是寻求较少的工作量获得较多的正确可靠的试验结果,其涉及到试验条件的筛选与优化问题。 为了考察较多的因素而不扩大试验规模,可使用正交试验设计,它是利用一套规格化的表格——正交表来 安排试验,适用于多因素、多水平、试验误差较大,周期长等一类型的试验,是效率较高的一种试验方法,在确 定最佳反应试验条件,饲养效率最优化的饲料组方,联合用药复合制剂的最佳配方等多因素多水平的优化实验中 都需要采用这一试验设计。 现以实例说明正交试验设计的用途与试验设计方法与统计分析。 某化工厂改革“潘生丁”环合反应旧工艺,其主要目的是想利用尿素与双乙烯酮来代替旧工艺中的硫脲及 乙酰醋酸乙酯,其指标是 6-甲基脲嘧啶的收率。 分析,本试验目的主要考察三个主要反应条件: 反应温度(A),反应时间(B)投料先分子比(C)尿素:双乙烯酮。现要找出这三个因素的最佳反应条件, 使收率最高。 每个因素试验三个水平: A 反应温度 A1=100℃ A2=110℃ A3=120℃ B 反应时间 B1=6h B2=8h B3=10h C 投料比 C1=1:1.2 C2=1:1.6 C3=1:2.0 这是一个因素三水平的试验,现在通过正文试验的目的是找出这三个因素中,如何搭配其水平,才能获得 最高的 6-甲基脲嘧啶的收率? 第一种作法:——全面试验法,即对三个因素的所有水平的搭配进行全面试验,此时共有 3 3=27 次,具体 是