试验设计与分析 试验结果分析 第四章试验结果的分析 回归分析
试验设计与分析 试验结果分析
试验设计与分析 试验结果分析 4.3均匀试验设计结果的回归分析 1.回归分析基本方法 若变量之间存在关系,这种关系一般有两种。 (1)确定性关系:变量之间存在完全确定的函数关系。一般可 表达为:Ff(x,2…x),并称x,2…x为自变量,为因变量。 例如众所周知的欧姆定律,I=V/R,三个变量中只要知道其中 的两个,剩余的一个变量可准确计算出来。 (2)相关关系:在许多工程中,由于关系复杂或受试验误差影 响,很难得到精确的数学表达式,从而使变量之间的关系存 在某种不确定性,但又服从某种统计规律,可以用统计方法 进行研究,称之为相关关系。例如:随着煤炭密度的增加, 其对应的基元灰分在增加,但这种增加的规律是不确定的。 同一矿区不同煤层的煤炭,相同密度级煤炭的灰分一般不同, 不同矿区同一煤层的煤炭,相同密度级煤炭的灰分一般也不 同,但随密度增加灰分增加的规律相同
试验设计与分析 试验结果分析 1. 回归分析基本方法 若变量之间存在关系,这种关系一般有两种。 (1)确定性关系: 变量之间存在完全确定的函数关系。一般可 表达为:y=f(x1,x2…xn),并称x1,x2…xn为自变量,y为因变量。 例如众所周知的欧姆定律,I=V/R,三个变量中只要知道其中 的两个,剩余的一个变量可准确计算出来。 (2)相关关系: 在许多工程中,由于关系复杂或受试验误差影 响,很难得到精确的数学表达式,从而使变量之间的关系存 在某种不确定性,但又服从某种统计规律,可以用统计方法 进行研究,称之为相关关系。例如:随着煤炭密度的增加, 其对应的基元灰分在增加,但这种增加的规律是不确定的。 同一矿区不同煤层的煤炭,相同密度级煤炭的灰分一般不同, 不同矿区同一煤层的煤炭,相同密度级煤炭的灰分一般也不 同,但随密度增加灰分增加的规律相同
试验设计与分析 试验结果分析 利用统计方法研究这种相关关系称为回归分析,有时也称为 相关分析。回归分析主要处理连续型随机变量之间的相关关 系,利用它来建立经验模型,检验模型的显著性,估计模型 中的参数,确定最佳条件,实现预测和控制。 2.一元线性回归 N组数据x,y,x是确定性变量,y为服从正态分布的随机变 量,假定它们之间存在线性关系,则可以用一个回归方程表 示:=a+bx。 1、回归系数的确定 回归系数的确定采用最小二乘法,即在精确度相等而误差呈正 态分布的许多试验数据中求得最优概值的方法,其判断标准为 各数据的偏差平方和为最小
试验设计与分析 试验结果分析 利用统计方法研究这种相关关系称为回归分析,有时也称为 相关分析。回归分析主要处理连续型随机变量之间的相关关 系,利用它来建立经验模型,检验模型的显著性,估计模型 中的参数,确定最佳条件,实现预测和控制。 2. 一元线性回归 N组数据xi,yi,x是确定性变量,y为服从正态分布的随机变 量,假定它们之间存在线性关系,则可以用一个回归方程表 示: 。 1、回归系数的确定 回归系数的确定采用最小二乘法,即在精确度相等而误差呈正 态分布的许多试验数据中求得最优概值的方法,其判断标准为 各数据的偏差平方和为最小。 y a bx
试验设计与分析 试验结果分析 0=∑0%-)2=20-a-bx)2 31 根据最小二乘法的基本原理,回归系数,b的大小应使偏差平方和Q为最小。根据极 值原理,有 82 =-2∑0-a-bx)=0 Ba 1-1 ap =-2∑(0%-a-bx)x=0 ab i-1 记元=∑/W,5=为1W, i-1 l a=立-bx 1N N
试验设计与分析 试验结果分析
试验设计与分析 试验结果分析 令 的2以0-2是w 1 i-1 则 b=iy ixx 2、模型显著性检验 在确定系数时,假设x,y间呈线性关系,这种假设是否正 确,就要对回归模型的显著性进行检验。一元线性回归模型 显著性用相关系数检验。 在因变量y的偏差平方和中,有两方面的因素引起y变化。 (1)当x取不同的x时,引起y的变化; (2)试验误差及其它随机因素的影响
试验设计与分析 试验结果分析 2、模型显著性检验 在确定系数时,假设x,y间呈线性关系,这种假设是否正 确,就要对回归模型的显著性进行检验。一元线性回归模型 显著性用相关系数检验。 在因变量y的偏差平方和中,有两方面的因素引起yi变化。 (1)当x取不同的xi时,引起yi的变化; (2)试验误差及其它随机因素的影响
试验设计与分析 试验结果分析 物含%驴+明 =0,-》+20,9-列+20:- 可以证明,上式中第二项为0: 会6为-a-妖a+%-列=2%a-6-标 N =b∑b%-a-bxx-标2b片-a-bx)=0-0=0 N 0=】 +-=e+0 7=2氏-=2a+a+b=8空写-驴=8kx=bx=如y 回归平方和U由x的变化引起,反映由于x与y间线性关系引 起的变化,它的大小说明了自变量x的重要性。 剩余平方和(残差平方和)Q,反映了试验误差和其他因素 的影响。 在总偏差平方和一定的条件下,剩余平方和Q越小,变量x 与y之间的线性关系越明确,U就越接近yy,其比值接近于 1。反之,接近于0
试验设计与分析 试验结果分析 回归平方和U由x的变化引起,反映由于x与y 间线性关系引 起y的变化,它的大小说明了自变量x 的重要性。 剩余平方和(残差平方和)Q,反映了试验误差和其他因素 的影响。 在总偏差平方和一定的条件下,剩余平方和Q越小,变量x 与y 之间的线性关系越明确,U就越接近lyy,其比值接近于 1。反之,接近于0
试验设计与分析 试验结果分析 令 R2= U 00 则 2= bhry by ky y ixx lyy R= Ixy xxby R称为相关系数,数值在-1到1之间。R的大小反映着变量x与 y之间的线性密切程度。R与b同号,负值称负相关,说明y随 x增加而减小,正值称正相关,说明y随x增加而增加。 用相关系数R判断x与y之间的线性密切程度准测是: (1)「R「=1,确定性线性关系 (2)|R|=0,无线性关系。无关系或是其它关系 (3)0<「R<1,查相关系数表。表中给出了不同自由度和 显著性水平下的临界相关系数,对一元线性回归,自由度 N2。如果R值大于表中某水平下的数值,则有1-α的把握 说回归方程是显著的,或有1必的把握说x与y间存在线性关 系。百由度越小,其临弃相关系数值越天,虽然越接近子1 越好,但要注意自由度
试验设计与分析 试验结果分析 R称为相关系数,数值在-1到1之间。R的大小反映着变量x 与 y 之间的线性密切程度。R与b同号,负值称负相关,说明y随 x增加而减小,正值称正相关,说明y随x增加而增加。 用相关系数R判断x 与y 之间的线性密切程度准则是: (1)︱R︱ =1,确定性线性关系 (2)︱R︱ =0,无线性关系。无关系或是其它关系 (3)0< ︱R︱ <1,查相关系数表。表中给出了不同自由度和 显著性水平下的临界相关系数,对一元线性回归,自由度 f=N-2。如果R值大于表中某水平下的数值,则有1- 的把握 说回归方程是显著的,或有1- 的把握说x与y间存在线性关 系。自由度越小,其临界相关系数值越大,虽然越接近于1 越好,但要注意自由度
试验设计与分析 试验结果分析 3、回归方程的精度 通过计算,可以得到一元线性回归的剩余均方差 9-尸 S=1 W-2 从统计学角度可以证明均方差S代表着变量y偏离回归直线的误差,对应任一固定的 ,相应观测值片将以1-a的概率落在区间(今一Z.2S,:+Z.2S),其中Z2是标准正 态分布上af2分位点。 如图4-1所示,在回归直线=a+bx的上下做两条平行线(虚线), Li:y=a+bx-Zans L2:y=a+bx+2anS 它表明,在全部可能出现的观察值片中,大约有100(1-x)%的点落在这两条线L1与 2之间的范围内。 Li:y=a+bx-ZanS =a+bx Z.nS Ls:y=a+bx+ZanS 图4-1一元线性回归的预测
试验设计与分析 试验结果分析 3、回归方程的精度 通过计算,可以得到一元线性回归的剩余均方差
试验设计与分析 试验结果分析 实例:煤中的无机硫主要是硫铁矿硫。从矿物学的角度来 说,总有一些亲硫元素如Pb、As、Ni、Co等会以类质同象 赋存于硫铁矿中或呈单独硫化矿与硫铁矿共存于煤中。下表 是某原煤不同密度级中S,N的含量,试对它们进行线性回 归,求模型参数与相关系数。 解:将计算过程列于下表中 线性回归计算表 编号 x(Sa】 y (Ni) x2 y2 xy y 46 .2116 .92 5.3 3.3 2 1.3 3.3 1.69 10.89 4.29 6.6 3.3 3 3.78 8.2 14.2884 67.24 30.996 10.6 2.4 4 5.17 13.2 26.7289 174.24 68.244 12.8 -.4 5 7.84 22 61.4656 484 172.48 17.0 -5.0 6 8.69 24.6 75.5161 605.16 213.774 18.3 -6.3 7 30.49 50.2 929.6401 2520.04 1530.598 52.9 2.7 习 57.73 123.5 1109.5407 3865.57 2021.302 动 10=633.4331 yy=1686.677 0-99.19 =1002.7799 S-4.45 =4.5869 b=1.5831 R.9702
试验设计与分析 试验结果分析 实例:煤中的无机硫主要是硫铁矿硫。从矿物学的角度来 说,总有一些亲硫元素如Pb、As、Ni、Co等会以类质同象 赋存于硫铁矿中或呈单独硫化矿与硫铁矿共存于煤中。下表 是某原煤不同密度级中S,Ni的含量,试对它们进行线性回 归,求模型参数与相关系数。 解:将计算过程列于下表中
试验设计与分析 试验结果分析 本回归数据总数N=7,自由度5,查相关系数表 R0oo1=0.95074,R>R0oo1,所以说煤中Ni含量与硫铁矿硫之间 存在显著的线性关系。 3.可线性化曲线的线性回归 有一些非线性函数可先通过代数变换转换成线性关系,再利 用线性回归方法求得函数参数。 曲线的直线化回归分为3步 (1)用试验数据绘制散点图,结合专业知识和经验选择适 宜的函数,将函数线性化,同时将原始数据也按同样方式进 行转化; (2)用线性回归方法对转换后的试验数据进行回归,求得 回归系数和线性回归相关系数; (3)对线性回归系数进行反变换,得到曲线函数的回归系 数,计算曲线的回归精度和相关系数
试验设计与分析 试验结果分析 本回归数据总数N=7,自由度f=5,查相关系数表 R0.001=0.95074,R>R0.001,所以说煤中Ni含量与硫铁矿硫之间 存在显著的线性关系。 3.可线性化曲线的线性回归 有一些非线性函数可先通过代数变换转换成线性关系,再利 用线性回归方法求得函数参数。 曲线的直线化回归分为3步 (1)用试验数据绘制散点图,结合专业知识和经验选择适 宜的函数,将函数线性化,同时将原始数据也按同样方式进 行转化; (2)用线性回归方法对转换后的试验数据进行回归,求得 回归系数和线性回归相关系数; (3)对线性回归系数进行反变换,得到曲线函数的回归系 数,计算曲线的回归精度和相关系数