仪器分析中的计算机方法 回归分析的原理及应用 在分析化学,特别是仪器分析中,常常需要做工作曲线(也叫标准曲线,或校 正曲线,或检量线)。例如,原子吸收法中作吸光度和浓度的工作曲线,极谱法中作 波高和浓度的工作曲线等等。在分析化学中所使用的工作曲线,通常都是直线。一 般是把实验点描在坐标纸上,横坐标Ⅹ表示被测物质的浓度,叫自变量。大都是把 可以精确测量或严格控制的变量(如标准溶液的浓度)作为自变量;纵坐标y表示 某种特征性质(如吸光度、波高等)的量,称因变量,一般设因变量是一组相互独 立、其误差服从同一正态分布N(O,σ2)的随机变量。然后根据坐标纸上的这 些散点(实验点)的走向,用直尺描出一条直线。这就是分析工作者习惯的制作工 作曲线的方法。 若吸光度——浓度的直线能通过所有实验点,在统计上就说溶液的吸光度和浓 度有最密切的线性关系。吸光度完全依赖于浓度的改变而变,完全遵循比尔定律 实验条件中的各种偶然因素对它无任何影响(亦即没有实验误差)。我们称这种关 系为确定性关系或函数关系。这时做工作曲线图的任务比较简单,借助于一支直尺 和一支铅笔,就能完成。但是由于实验中不可避免的有误差存在,实验点全部密集 在回归线上的情况通常是极少见的,尤其当误差较大时,实验点比较分散,并不在 条线上,这时作图就有困难了。因为凭直觉很难判断怎样才能使所联的线对干所 有实验点来说是误差最小的,亦即难于确定到底哪条线才是最好的回归线。 例如,用火焰原子吸收法测定镁,得到下表数据 Mg(ppm)0. 00 0.202 0.410 0.553 0.641 0.736 bbⅢ 05 0e 0°8 0°5 =0°313x+0°0292 A=0°833x+0°0113 图中的工作曲线是用 Excel的方法回归得到,选取的数据点不同,R就不一样
仪器分析中的计算机方法 ---回归分析的原理及应用 在分析化学,特别是仪器分析中,常常需要做工作曲线(也叫标准曲线,或校 正曲线,或检量线)。例如,原子吸收法中作吸光度和浓度的工作曲线,极谱法中作 波高和浓度的工作曲线等等。在分析化学中所使用的工作曲线,通常都是直线。一 般是把实验点描在坐标纸上,横坐标 X 表示被测物质的浓度,叫自变量。大都是把 可以精确测量或严格控制的变量(如标准溶液的浓度)作为自变量;纵坐标 y 表示 某种特征性质(如吸光度、波高等)的量,称因变量,一般设因变量是一组相互独 立、其误差服从同一正态分布 N(Ο,σ2)的随机变量。然后根据坐标纸上的这 些散点(实验点)的走向,用直尺描出一条直线。这就是分析工作者习惯的制作工 作曲线的方法。 若吸光度----浓度的直线能通过所有实验点,在统计上就说溶液的吸光度和浓 度有最密切的线性关系。吸光度完全依赖于浓度的改变而变,完全遵循比尔定律。 实验条件中的各种偶然因素对它无任何影响(亦即没有实验误差)。我们称这种关 系为确定性关系或函数关系。这时做工作曲线图的任务比较简单,借助于一支直尺 和一支铅笔,就能完成。但是由于实验中不可避免的有误差存在,实验点全部密集 在回归线上的情况通常是极少见的,尤其当误差较大时,实验点比较分散,并不在 一条线上,这时作图就有困难了。因为凭直觉很难判断怎样才能使所联的线对干所 有实验点来说是误差最小的,亦即难于确定到底哪条线才是最好的回归线。 例如,用火焰原子吸收法测定镁,得到下表数据 Mg(ppm) 0.00 0.20 0.40 0.60 0.80 1.00 A 0.00 0.202 0.410 0.553 0.641 0.736 图中的工作曲线是用 Excel 的方法回归得到,选取的数据点不同,R 就不一样。 原子吸收测镁 y = 0.7343x + 0.0565 R 2 = 0.9669 y = 0.9335x + 0.0112 R 2 = 0.9936 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.2 0.4 0.6 0.8 1 1.2 ppm A
最小二乘法原理 若用(x;,y;)表示n个数据点(i=1,2,3,……,n),而任意一条直 线方程可写成 a+bx (1) 在(1)式中,采用y符号,表示这是一条任意的直线,如果用这条直线来代表x 和y的关系,即对每个已知的数据点(x;,y)来说,其误差为 令各数据点误差的平方的加和(差方和)为Q,则Q是总的误差: (vi-a-bxi) f=1 回归直线就是在所有直线中,差方和Q最小的一条直线换句话说,回归直线 系数b及常数项a,应使Q达到极小值. 根据微积分求值的原理,要使Q达到极小值,只需将(3)式分别对a,b求偏 微商,令它们等于0.于是a,b满足 2=2(y-a-bx)2(-a=bx ab ab 2之(y-a-bx)x=O 从(4)式可得到 bxi ⅵ=H
一. 最小二乘法原理 若用(χi, y i )表示 n 个数据点(i=1,2,3,...,n),而任意一条直 线方程可写成: y = a + bx * (1) 在(1)式中,采用 y *符号,表示这是一条任意的直线,如果用这条直线来代表 x 和 y 的关系,即对每个已知的数据点(xi,yi)来说,其误差为 yi − y = yi − a − bxi * (2) 令各数据点误差的平方的加和(差方和)为 Q,则 Q 是总的误差: (3) 回归直线就是在所有直线中,差方和 Q 最小的一条直线.换句话说,回归直线的 系数 b 及常数项 a,应使 Q 达到极小值. 根据微积分求值的原理,要使 Q 达到极小值,只需将(3)式分别对 a,b 求偏 微商,令它们等于 0.于是 a,b 满足 (4) (5) 从(4)式可得到 2 1 * ( ) = = − n i Q yi y 2 1 ( i) n i = yi − a − bx = a y a bx y a bx a Q i i n i i i − − = − − = ( ) 2 ( ) 1 = = − − − = n i yi a bxi 1 2 ( ) 0 = − − = − − n i i i i i b y a bx y a bx b Q 1 ( ) 2 ( ) 2 ( ) 0 1 = − − − = = i n i yi a bxi x = = = − − = − − = n i n i n i yi a bxi yi na b xi 1 1 1 ( ) 0 = = = − n i n i na yi b xi 1 1
b bx x,y分别代表x和y的坳值。从式(5)可得到 a--bxixi 2xo-a2xr-b2x/=O 将(6)式代入,得 x x;)( x;) 所以 x)(>v) 根据差方和关系式,若令 Maxx (x-x)2=>( 2x+x2) ) ∑x2-Cx)=∑x;2-n
(6) x, y 分别代表xi和yi的平均值。从式(5)可得到 将(6)式代入,得 所以 根据差方和关系式,若令 a y bx x n y b n a n i n i i i = − = =1 − • =1 1 1 0 ( ) 1 1 1 1 − − 2 = − − = = = = = n i n i n i i i i i n i i i i x y a x b x y a bx x ( ) 0 1 2 1 1 − − − = = = = n i i n i i i n i i i i x b x n x b n y x y − = − 2 ( ) 1 ( )( ) 1 2 i i i i i xi n x y b x n x y − − = 2 2 ( ) 1 ( )( ) 1 i i i i i i x n x x y n x y b − − = 2 2 x nx x y nxy i i i ( ) ( 2 ) 2 2 2 lxx = xi − x = xi − xix + x = 2 − 2 + 2 xi x xi nx 2 2 2 = − • + n x x n n x x i i i i 2 2 2 ( ) ( ) 2 2 n x n n x x i i i = − + • ( ) 2 1 2 2 2 x x nx n = xi − i = i −
同理 之(x-3)2 Vl l=∑(x-x)(-y) 可推出 ∑xm-(x)∑y) b >(xi-x)(i-y)xy 由观测值(一组样本)算出a,b的值,称为参数a,b的估算值,用符号a,b,表 示,于是回归直线方程式便可确定如下 a+bx 式中,a,b分别表示由样本求得的y,a,b的估算值。如果 则有, 这种方法就称为最小二乘法,即也就是“最小差方和法”。 回归方程的类型 这里的“线性”,是对a,b而言,对y,x并不一定。只要通过适当 变化,a,b仅为一次待确定参数,就可使用这种方法求出。 例:1.双曲线 +b (令y=-;x'= y 2.抛物线 y=b(x-c)2+a(x’=(x-c)2 幂函数 y, x'=log x, a= log d 4指数函数y=dex…y=hya=hd]
同理, 可推出: 由观测值(一组样本)算出 a,b 的值,称为参数 a,b 的估算值,用符号 a b ˆ ˆ , ,表 示,于是回归直线方程式便可确定如下: y ˆ = a ˆ + b ˆ x 式中 y a b ˆ ˆ , ˆ , 分别表示由样本求得的 y,a,b 的估算值。如果 x = x ,则有, y ˆ = y 这种方法就称为最小二乘法,即也就是“最小差方和法”。 二. 回归方程的类型 这里的“线性”,是对 a,b 而言,对 y,x 并不一定。只要通过适当 变化,a,b 仅为一次待确定参数,就可使用这种方法求出。 例:1.双曲线 x a b y 1 1 = + (令 x x y y 1 ; 1 = = ) 2.抛物线 y = b x −c + a 2 ( ) ( 2 x = (x − c) ) 3.幂函数 b y = dx [ y = log y; x = log x,a = log d] 4.指数函数 y de y y a d bx = ........[ = ln ; = ln ] 2 lyy =(yi − y) 2 2 2 2 ( ) 1 y y ny n = yi − i = i − lxy =(xi − x)(yi − y) =xiyi − nxy lxx lxy x x x x y y x n x x y n x y b i i i i i i i i i = − − − = − − = 2 2 2 ( ) ( )( ) ( ) 1 ( )( ) 1
5.指数函数 Ly=hn y x'=-; a=In d] 6.S型曲线 be 7.对数曲线 =a+ b log x.[x′=logx 回归方程的显著性检验 1.关系数R 在求回归方程时,假定y与x存在线性关系。怎样判别这种关系的好 坏呢?引入R这个相关系数的概念。首先让我们讨论一些有关概念: 回归平方和 ∑(-1)2=∑[b(x-X 剩余平方和 ∑(-y)2 总离差平方和 y=O+U Laxly R的正负号由Lxy的符号决定,即与b同号。R的绝对值为小于1,大于0的无量 纲统计量。 当|R≌1时,表明y与x之间线性关系密切。|R≌20时,表明y与x之间无 线性关系。通常使用R2,具有更实际的意义 2.著性检验F U/(f1=1) Q(J2=n-2) b·Lxy (n-2) f1-回归差和自由度,f2-残余差方和自由度。 FFa,表明回归方程是显著性的
5.指数函数 b x y de / = [ a d x y y x ; ln 1 = ln ; = = ] 6.S 型曲线 ] ; 1 .......[ 1 x e x e y y x a b y − = = − + = 7.对数曲线 y = a + blog x......[x = log x] 三. 回归方程的显著性检验 1. 关系数 R 在求回归方程时,假定 y 与 x 存在线性关系。怎样判别这种关系的好 坏呢?引入 R 这个相关系数的概念。首先让我们讨论一些有关概念: 回归平方和 = − = − 2 2 U (y ˆ y) [b(x x)] 剩余平方和 = − 2 Q (yi y ˆ) 总离差平方和 Lyy = Q +U 令: LxxLyy L R xy = Lyy U LxxLyy Lxy R = = 2 2 R 的正负号由 Lxy 的符号决定,即与 b 同号。R 的绝对值为小于 1,大于 0 的无量 纲统计量。 当|R|≌1 时,表明 y 与 x 之间线性关系密切。|R|≌0 时,表明 y 与 x 之间无 线性关系。通常使用 R 2,具有更实际的意义。 2. 著性检验 F /( 2) /( 1) 2 1 = − = = Q f n U f F ( − 2) − • • = n Lyy b Lxy b Lxy f1-回归差和自由度,f2-残余差方和自由度。 F<Fa(临界 F 值,见表),y 与 x 无线性关系;F>Fa,表明回归方程是显著性的
假设是可靠的。 3.回归线的精度 可以使用回归方程得到y的平均值j。那么实际的y离y值偏差多大呢?即回归的 精度如何呢?通常规定,剩余平方和Q除以它的f,所得商称为剩余方差 S 剩余方差的平方根称为剩余标准偏差:S 2 代入R后, )·yy S值越小,说明精度越高 四.使用 Excel回归计算
假设是可靠的。 3. 回归线的精度 可以使用回归方程得到 y 的平均值 y ˆ 。那么实际的 y 离 y ˆ 值偏差多大呢?即回归的 精度如何呢?通常规定,剩余平方和 Q 除以它的 fQ,所得商称为剩余方差: 2 2 − = n Q S 剩余方差的平方根称为剩余标准偏差: − 2 = n Q S 又可得 2 ( ˆ) 2 − − = n y y S i 代入 R 后, 2 (1 ) 2 − − • = n R Lyy S S 值越小,说明精度越高。 四. 使用 Excel 回归计算