
第八节建立线性函数的实验方法一一元线性回归分析主要内容:一元线性回归方程的建立二、回归方程的显著性研究
第八节 主要内容: 一、一元线性回归方程的建立 二、回归方程的显著性研究 建立线性函数的实验方法 一元线性回归分析

确定关系一函数关系J变量之间的线性关系,直线方程:两种关系y=ax+b非确定关系一相关关系大随机变量之间的关系具人的身,人的年气象的高与体龄与血温度与压重湿度回归分析是研究相关关系的一种数学工具它帮助从一个变量的取值,去估计另一个变量的取值
变量之间的 两种关系 确定关系 — 函数关系 非确定关系 — 相关关系 随机变量之间的关系 人的身 高与体 重 人的年 龄与血 压 线性关系,直线方程: y = ax + b 气象的 温度与 湿度 回归分析是研究相关关系的一种数学工具, 它帮助从一个变量的取值,去估计另一个变量 的取值

背景19世纪英国遗传学家高尔登(Galton)在血缘关系研究中发现:从总体看,子女身高有向其父母身高靠近的趋势,他把这种趋势称为“回归”·通过大量数据,归纳出了父亲身高x与子女身高v的估计值之间的数学表达式为v = 0.516x + 85.6742(单位cm)误差 Ay=y-j从此以后人们便将“回归”一词作为研究事物相关关系的专用统计用语
背景 19世纪英国遗传学家高尔登(Galton)在血 缘关系研究中发现: 从总体看,子女身高有 向其父母身高靠近的趋势, 他把这种趋势称 为“回归”. 通过大量数据, 归纳出了父亲 身高 x 与子女身高y的估计值 之间的数学 表达式为 y ˆ y x ˆ = + 0.516 85.6742 (单位cm) 从此以后人们便将“回归”一词作为研究 事物相关关系的专用统计用语. 误差 = − y y y ˆ

一元线性回归分析:仅研究一个变量和另一个变量的线性相关关系,用回归直线方程=a+bx来近似表示变量x与y之间的关系一元回归方程的建立一元回归直线方程v=a+bx回归系数回归常数建立回归直线方程的关键是求出a,b
一元线性回归分析: 仅研究一个变量和另 一个变量的线性相关关系. 用回归直线方程 y a bx ˆ = + 来近似表示变量x与y之间的关系. 一、一元回归方程的建立 y a bx ˆ = + 一元回归直线方程 回归常数 回归系数 建立回归直线方程的关键是求出a, b

对x,y进行n次独立试验,得到n对观测数据(x,y),i=l,…,n,为便于代数运算,用误差的平方和表示总误差yf =Z4'y, =Z(y -@-bx)2i=1i1为使f达到最小值,由微积分中求极值原理,(a,b)需满足以下方程组:af未知量-2Z(y; -a-bx,)= 0dai=1naf-2Z(y; -a -bx,)x, = 0abi=1
对x,y进行n次独立试验, 得到n对观测 数据 ,为便于代数运算,用 误差的平方和表示总误差. ( , ), 1,., i i x y i n = ˆ i y 2 2 1 1 ( ) n n i i i i i f y y a bx = = = = − − 为使 f 达到最小值, 由微积分中求极值 原理, a, b 需满足以下方程组: 1 1 2 ( ) 0 2 ( ) 0 n i i i n i i i i f y a bx a f y a bx x b = = = − − − = = − − − = 未知量

解方程组,得到a,b的估计值:a=-xSZ(x; -x)(y; - J)xy6:sE(x; -x)2xx2Z其中,x=X,J=yinni=1Li=1把a,b的值代入,即得到y关于x的回归直线方程
解方程组, 得到a,b的估计值: 2 ( )( ) ( ) i i xy i xx a y bx x x y y S b x x S = − − − = = − 把a, b的值代入 , 即得到y 关于x 的回归直 线方程. y ˆ 1 1 1 1 , . n n i i i i x x y y n n = = 其中, = =

在一次关于教师对学生的综合评价与学生参例1加升学考试总分(数学、语文两科总分)关系的研究中,10名学生的评选结果与升学考试总分如下:教师评价分数x:40,42,48,55,65,79,88,100,120,140升学考试总分y:150,140,160,170,150,162,185,165,190,185试建立考试总分对教师评价分数x的回归方程
在一次关于教师对学生的综合评价与学生参 加升学考试总分(数学﹑语文两科总分)关系 的研究中,10名学生的评选结果与升学考试总 分如下: 教师评价分数 x: 40,42,48,55,65,79,88,100,120,140 升学考试总分 y: 150,140,160,170,150,162,185,165,190,185 试建立考试总分y对教师评价分数x的回归方 程. 例1

解由于x=77.7,J=165.7,代入公式得a=y-bxSE(x, -x)(y; -J)xySZ(x,-x)2xx(40 - 77.7)(150 -165.7) + ..: + (140 - 77.7)(185 -165.7)b=(40 - 77.7)2 + .: + (140 -77.7)= 0.4a=165.7-0.4× 77.7 = 134.62故所求回归方程为:=134.62+0.4x
由于 x y = = 77.7, 165.7 , 代入公式得 2 2 (40 77.7)(150 165.7) (140 77.7)(185 165.7) (40 77.7) (140 77.7) 0.4 b − − + + − − = − + + − = a = − = 165.7 0.4 77.7 134.62 y x ˆ = + 134.62 0.4 . 解 故所求回归方程为: 2 ( )( ) ( ) i i xy i xx a y bx x x y y S b x x S = − − − = = −

回归方程的显著性研究二=a+bx所呈现的x,y之间的相关关系是否真实,需要进行统计推断.常用的方法之一是相关系数推断法相关系数一一一两个变量相关关系密切程度的定量指标,记作r,经证明 -1≤r≤1·[r=1,两变量完全相关:[r|越接近于1,线性相关性越强实际应用中,使用样本观测值考察变更量之间的相关程度
二、回归方程的显著性研究 所呈现的x, y之间的相关关系 是否真实, 需要进行统计推断. 常用的方法 之一是相关系数推断法. y a bx ˆ = + 相关系数———两个变量相关关系密切程度 的定量指标, 记作 r ,经证明 − 1 1 r . | | 1 r = , 两变量完全相关; | | r 越接近于1, 线性相关性越强. 实际应用中,使用样本观测值考察变更量 之间的相关程度

定义设(x,,y),i=l,,n为n个数据对(即样本观测值),称1(x -x)(y;-)SxyE(x,-x) ,E(:-)xxV1为x与y的相关系数例1中经计算r=0.81,比较接近1,故相关性比较显著,用回归方程解释>与x关系是有意义的
2 2 1 ( )( ) 1 1 ( ) ( ) i i xy xx yy i i x x y y S n r S S x x y y n n − − = = − − 为 x 与 y 的相关系数. 设 为 个数据对(即样本 观测值), 称 ( , ), 1,., i i 定义 x y i n = n 例1中经计算 ,比较接近1, 故相 关性比较显著,用回归方程解释y与x关系是 有意义的. r = 0.81