正在加载图片...
第七章 线性回归模型 §7.1 引言 线性回归模型是现代统计学中应用最为广泛的模型之一,它也是其它统计模型研究或应用 的基础。这主要有下列几个原因: 1.在实际问题中,变量之间的关系常具有线性或近似线性的依赖关系。 2.在现实世界中,虽然许多变量间的关系是非线性的,但经过适当的变换,将会成为线性 关系。 3.线性关系是变量之间最简单的关系,容易处理,理论和方法比较完善,这些为实际应用 提供了有效算法。 本节将通过实例说明线性统计模型的背景和分类。 一、一元线性回归模型 变量之间的关系大致可分为确定性关系和非确定性关系两大类,数理统计是处理非确定性 变量统计规律性的学科。线性回归模型是非确定性(具有随机性)变量之间关系的最基本的模型 之一,如人的体重(Y)与身高(X)之间有一定的相依关系:当X大时,Y也倾向于大,但X不 能严格决定Y。小麦产量(Y)与小麦品种(X)、施肥量(X2)和浇水量(X3)有一定的关系,但还 不能严格利用数学函数关系表达它们之间的关系。 以上例子中,通常称Y为因变量或响应变量,称X为自变量。Y的值有两部分组成:一部 分是能够由X决定的部分,它是X的函数,记为f(X):另一部分是由其它众多未加考虑的因素 产生的影响,称为随机误差,故有: Y=f(X)+e, (7.1.1) 这里e作为随机误差,假定E()=0。特别,当f(X)是线性函数时,f(X)=Bo+BX,则有 Y=Bo +B1X +e. (7.1.2) (71.2)式称为线性回归模型或线性回归方程,其中B和B1未知,常数项是回归直线y= B0+B1X的截距,B1是斜率。 设有一组样本(x,),i=1,2…n,将上述模型用样本表示为 y=B0+6xi+ei,i=1,2.··n. (7.1.3) e:为随机误差。若用适当的估计方法求得o,B1的估计为%和1,代入到(7.1.2)中将误差项©:用 其均值0代替,得到 Y=o+31X, (7.1.4) 称为经验回归方程,它是由n组样本观察值获得的。如果经检验,是合适的回归方程,则(71.4) 刻画了Y与X之间的相关关系。1 ‘ Ÿ Ç 5 £ 8  . §7.1 ⁄ Û Ç5£8.¥yì⁄OÆ•A^Åè2ç.Éòßß襟ß⁄O.Ôƒ½A^ ƒ:"˘ÃákeA᜵ 1. 3¢SØK•ßC˛Ém'X~‰kÇ5½CqÇ5ù6'X" 2. 3y¢­.•ßè,NıC˛m'X¥öÇ5ß²L·CÜßÚ¨§èÇ5 'X" 3. Ç5'X¥C˛ÉmÅ{¸'XßN¥?nßnÿ⁄ê{'ıߢ è¢SA^ J¯ ké{" !ÚœL¢~`²Ç5⁄O.µ⁄©a" ò!òÇ5£8. C˛Ém'Xåóå©è(½5'X⁄ö(½5'X¸åaßÍn⁄O¥?nö(½5 C˛⁄O5Æ5Æâ"Ç5£8.¥ö(½5(‰këÅ5)C˛Ém'XŃ. ÉòßX<N­(Y ) Üp(X) Émkò½Éù'XµX åûßY èñïuåßX ÿ UÓÇ˚½Y "ð˛(Y ) Üð¨´(X1)!ñù˛(X2) ⁄Y˛(X3) kò½'XßÑ ÿUÓÇ|^ÍƺÍ'XLàßÇÉm'X" ±˛~f•ßœ~°Y èœC˛½èAC˛ß°X ègC˛"Y äk¸‹©|§µò‹ ©¥U dX ˚½‹©ßߥX ºÍßPèf(X)¶,ò‹©¥dŸßØıô\ƒœÉ )Kèß°èëÅÿ ßkµ Y = f(X) + e, (7.1.1) ˘peäèëÅÿ ßb½E(e) = 0"AOßf(X)¥Ç5ºÍûßf(X) = β0 + β1XßKk Y = β0 + β1X + e. (7.1.2) (7.1.2) ™°èÇ5£8.½Ç5£8êßߟ•β0 ⁄β1 ôß~Íëβ0 ¥£8ÜÇy = β0 + β1X Âßβ1 ¥«" kò|(xi , yi), i = 1, 2 · · · nßÚ˛„.^L´è yi = β0 + β1xi + ei , i = 1, 2 · · · n. (7.1.3) ei èëÅÿ "e^·Oê{¶β0, β1 Oèβb0 ⁄βb1 ßì\(7.1.2)•Úÿ ëei ^ Ÿ˛ä0ìOß Y = βb0 + βb1X, (7.1.4) °è²£8êßßߥdn|* äº"XJ²uߥ‹·£8êßßK(7.1.4) èx Y ÜX ÉmÉ''X" 1
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有