回归分析 —数学建模与系统仿真 主讲:王晓峰 E-mail:xfwang8280126.com
回 归 分 析 ——数学建模与系统仿真 主讲:王晓峰 E-mail:xfwang828@126.com
回归分析 元线性回归 多元线性回归(原理略) 模 性 检 归性苫 线 定店洳曲的及 逐步回归分 定 归 非 中 2021/12/12 的 2
2021/12/12 2 一元线性回归 多元线性回归 回归分析 数 学 模 型 及 定 义 * 模 型 参 数 估 计 * 检 验 、 预 测 与 控 制 可 线 性 化 的 一 元 非 线 性 回 归 ( 曲 线 回 归 ) 数 学 模 型 及 定 义 * 模 型 参 数 估 计 * 多 元 线 性 回 归 中 的 检 验 与 预 测 逐 步 回 归 分 析 (原理略)
元线性回归一、数学模型 例1测16名成年女子的身高与腿长所得数据如下: 身高14314514614714915015315415556157158159160162164 腿长88858891「9939395%69897%69899100102 以身高x为横坐标,以腿长y为纵坐标将这些数据点(x,y 在平面直角坐标系上标出 解答 y=Bo+,x+a 2021/12/12 散点图 3
2021/12/12 3 一、数学模型 例1 测16名成年女子的身高与腿长所得数据如下: 身高 143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164 腿长 88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102 以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi) 在平面直角坐标系上标出. 140 145 150 155 160 165 84 86 88 90 92 94 96 98 100 102 散点图 y = + x + 0 1 解答 一元线性回归
般地,称由y=+Bx+E确定的模型 为一元线性回归模型,记为 y=月+Bx+ EE=0.DE=02 固定的未知参数B0、月称为回归系数,自变量x也称为回归变量 Y=Bo+B1x,称为y对x的回归直线方程 元线性回归分析的主要任务是: 1、用试验值(样本值)对β、B1和作点估计; 2、对回归系数B、B1作假设检验; 3、在x=x处对y作预测,对y作区间估计.返回 2021/12/12 4
2021/12/12 4 一般地,称由 y = + x + 0 1 确定的模型 为一元线性回归模型,记为 = = = + + 2 0 1 0, E D y x 固定的未知参数 0 、 1 称为回归系数,自变量 x 也称为回归变量. 一元线性回归分析的主要任务是: 1、用试验值(样本值)对 0 、 1 和 作点估计; 2、对回归系数 0 、 1 作假设检验; 3、在 x= 0 x 处对 y 作预测,对 y 作区间估计. Y x = 0 + 1 ,称为 y 对 x的回归直线方程. 返回
二、模型参数估计 1、回归系数的最小二乘估计 有n组独立观测值,(x1,y1),(x2,y2),…,(xn,yn) Bo+所x 设 EE1=0,DE1=2且E1E2…,,En相互独立 记9=Q(,B)=∑2=∑(-B-B1x) 最小二乘法就是选择B和B1的估计Bo,B1使得 @(Bo,B,=min @(Bo,B) Bo,BI 2021/12/12
2021/12/12 5 二、模型参数估计 1、回归系数的最小二乘估计 有 n 组独立观测值,(x1,y1),(x2,y2),…,(xn,yn) 设 = = = + + = i i 且 , n 相互独立 i i E D y x i n 0, ..., , 1,2,..., 1 2 2 0 1 记 ( ) = = = = = − − n i i i n i i Q Q y x 1 2 0 1 1 2 0 1 ( , ) 最小二乘法就是选择 0 和 1 的估计 0 ˆ , 1 ˆ 使得 ) min ( , ) ˆ , ˆ ( 0 1 , 0 1 0 1 Q = Q
Bo=y-Bx ∑(x-x)y,-y) i=1 解得 y Xy 或B1 ∑(x-x) 其中x=∑x,=∑yx2=∑ X ,y (经验)回归方程为:=B+Bx=y+B1(x-x) 2021/12/12
2021/12/12 6 −− == −2 2 10 1 x x xy x y ˆ x ˆ y ˆ 解得 (经验)回归方程为: ( ) ˆ ˆ ˆ ˆ 0 1 1 y = + x = y + x − x 或 ( )( ) ( ) = = − − − = ni i ni i i x x x x y y 1 2 1 1 ˆ = = = = = = = = ni i i ni i ni i ni i x y n x ,x y n y x n x , y n x 1 1 2 2 1 1 1 1 1 1 其中
四、可线性化的一元非线性回归(曲线回归) 例2出钢时所用的盛钢水的钢包,由于钢水对耐火材料的侵蚀, 容积不断增大我们希望知道使用次数与增大的容积之间的关 系对一钢包作试验,测得的数据列于下表 使用次数 增大容积 使用次数 增大容积 6.42 10.49 234567 8.20 10.59 9.58 10.60 10.80 9.70 1060 15 993 10.76 999 2021/12/12
2021/12/12 7 四、可线性化的一元非线性回归(曲线回归) 例2 出钢时所用的盛钢水的钢包,由于钢水对耐火材料的侵蚀, 容积不断增大.我们希望知道使用次数与增大的容积之间的关 系.对一钢包作试验,测得的数据列于下表: 使用次数 增大容积 使用次数 增大容积 2 3 4 5 6 7 8 9 6.42 8.20 9.58 9.50 9.70 10.00 9.93 9.99 10 11 12 13 14 15 16 10.49 10.59 10.60 10.80 10.60 10.90 10.76
10.5 散点图 6.5 此即非线性回归或曲线回归问题(需要配曲线) 配曲线的一般方法是: 先对两个变量x和y作n次试验观察得(x;,y,),i=1,2,,n画出散点图, 根据散点图确定须配曲线的类型然后由n对试验数据确定每一类曲线的未知 参数a和b采用的方法是通过变量代换把非线性回归化成线性回归,即采用 非线性回归线性化的方法 2021/12/12
2021/12/12 8 2 4 6 8 10 12 14 16 6 6.5 7 7.5 8 8.5 9 9.5 10 10.5 11 散 点 图 此即非线性回归或曲线回归问题(需要配曲线) 配曲线的一般方法是: 先对两个变量 x 和 y 作 n 次试验观察得(xi , yi ),i =1,2,..., n 画出散点图, 根据散点图确定须配曲线的类型.然后由 n 对试验数据确定每一类曲线的未知 参数 a 和 b.采用的方法是通过变量代换把非线性回归化成线性回归,即采用 非线性回归线性化的方法
通常选择的六类曲线如下: (1)双曲线=a+ (2)幂函数曲线y=ax,其中x0,a>0 (3)指数曲线y=ae其中参数a>0 (4)倒指数曲线y=aex其中a>0, (5)对数曲线y=a+ blogx, x>n 解例2由散点图我们选配倒指数曲线y=aex (6)S型曲线y a+be根据线性化方法,算得b=-1.1107,4=24587 由此 11.6789 1.1107 2021/12/12 最后得y=116789x 解答
2021/12/12 9 通常选择的六类曲线如下: (1)双曲线 x b a y = + 1 (2)幂函数曲线 y=a b x , 其中 x>0,a>0 (3)指数曲线y=a bx e 其中参数 a>0. (4)倒指数曲线 y=a b x e / 其中 a>0, (5)对数曲线y=a+blogx,x>0 (6)S 型曲线 x a b e y − + = 1 解例 2.由散点图我们选配倒指数曲线 y=a b x e / 根据线性化方法,算得 2.4587 ˆ 1.1107, ˆ b = − A = 由此 ˆ 11.6789 ˆ = = A a e 最后得 x y e 1.1107 11.6789 − = 解答
统计工具箱中的回归分析命令 1、多元线性回归 2、多项式回归 3、非线性回归 4、逐步回归 返回 2021/12/12 10
2021/12/12 10 统计工具箱中的回归分析命令 1、多元线性回归 2、多项式回归 3、非线性回归 4、逐步回归 返回