
线性回归方程的一个习惯性错误 一、问题提出 学生在使用课外资料时,他们发现很多资料在线性回归方程一节都选用了一 道类似的题,但解答相互矛盾,大家都选用,说明它得到公认是道好题,但矛盾 的解释似平都有道理,问题究竞出在哪呢? 圈一:工人工资(元)依劳动生产率(千元)变化的回自方程为y=50+80x 下列判新正确的是() A)劳动生产率为1000元时,工资为130元: )劳动生产率提高1000元时,工资平均提高80元: C)劳动生产率提高1000元时,工资平均提高130元: D)当月工资为250元时,劳动生产率为2000元. 资料上的答案是B。(选自优化设计北师大版) 圈二:工人工资(元)依劳动生产率(千元)变化的回自方程为y=80+70x 下列判断正确的是() 1)劳动生产率为1000元时,工资为150元: 2)劳动生产率提高1000元时,工资提高70元: 3)劳动生产率提高1000元时,工资提高150元: 4)当月工资为220元时,劳动生产率为2千元. A)(1)(2),B)(1(2)(4),C)(2)(4),D)(1)(2X34) 资料上答案也是B.(选自三点一测) 二,问题症结 我们先来看看上述间题的具体解答,其中题一的C)答案和圈二中的(3) 答案显然是情误的,而题一的A)和D)两答案犯了同一个错误,资料上的解 释是:线性回归方程是近似反映两组随机变量间的关系,它不是函数关系,换言 之,各散点不一定在回归直线上,因此我们利用回归方程根据一个变量推知另一
线性回归方程的一个习惯性错误 一、问题提出 学生在使用课外资料时,他们发现很多资料在线性回归方程一节都选用了一 道类似的题,但解答相互矛盾。大家都选用,说明它得到公认是道好题,但矛盾 的解释似乎都有道理,问题究竟出在哪呢? 题一:工人工资(元)依劳动生产率(千元)变化的回归方程为 y=50+80x, 下列判断正确的是() A) 劳动生产率为 1000 元时,工资为 130 元; B) 劳动生产率提高 1000 元时,工资平均提高 80 元; C) 劳动生产率提高 1000 元时,工资平均提高 130 元; D) 当月工资为 250 元时,劳动生产率为 2000 元。 资料上的答案是 B。(选自优化设计北师大版) 题二:工人工资(元)依劳动生产率(千元)变化的回归方程为 y=80+70x, 下列判断正确的是 ( ) 1)劳动生产率为 1000 元时,工资为 150 元; 2)劳动生产率提高 1000 元时,工资提高 70 元; 3)劳动生产率提高 1000 元时,工资提高 150 元; 4)当月工资为 220 元时,劳动生产率为 2 千元。 A) (1) (2) ,B) (1)(2)(4) ,C) (2)(4) ,D) (1)(2)(3)(4) 资料上答案也是 B.(选自三点一测) 二、问题症结 我们先来看看上述问题的具体解答,其中题一的 C)答案和题二中的(3) 答案显然是错误的,而题一的 A) 和 D)两答案犯了同一个错误,资料上的解 释是:线性回归方程是近似反映两组随机变量间的关系,它不是函数关系,换言 之,各散点不一定在回归直线上,因此我们利用回归方程根据一个变量推知另一

个变量只是一种估计或预测,不能象函数那样准确定位。这种解释与线性回归的 概念是一致的,按此说法,题二中的(1)(2)(4)均不正确,木题没有答案, 下面就看题一中B)答案是否正确,也就是说系数b真的可以表示随机变量× 每增加一个单位时随机变量y的平均增长量吗? 三、问题辨析 先看题三:某种产品的广告费支出×与销售额y(单位:百万元)之间有如 下对应数据: X 2 4 5 6 8 Y 30 40 60 50 70 如果×与y具有线性相关关系, 求线性回方程,并说明b的意义。(选自三点一测) 答案:=5,■50,■1380,■145,b■=6.5,a■-b=50-6.5*5=17.5, 于是所求的线性回归方程为:y=17.5+6.5x, b■6.5表示广告费每增加一百万元,销售额增加6.5百万元. 上表是通过统计的方式得到的两组离散变量,从中无论如何也得不出广告费 每增加一百万元,销售额增加6,5百万元这一结论,并且销售额增长的平均值也 不是6.5。那么对总体中这两组变量是否存在这一变化规律呢?我们知道线性回 归方程与选择的样本有关,样本变了b的值就变了,而总体中销售额增长的平均 值应是一个定值。其实线性相关只是说两组变量之间的关系近似一条直线(回归 直线》,而本例关于b的意义完全套用直线斜率k的意义,这显然不恰当。如果 题一认同A),D)是错误答案,那么B)也不正确,准确说法应为:销售额平 均提高约65百万元。平均值是一个唯一确定的值,平均并不代表模榈近似。到 此我们也清楚了题二答案的错误实顾就是把线性相关完全等可于函数关系了。 一、错误已成习惯
个变量只是一种估计或预测,不能象函数那样准确定位。这种解释与线性回归的 概念是一致的,按此说法,题二中的(1)(2)(4)均不正确,本题没有答案。 下面就看题一中 B)答案是否正确,也就是说系数 b 真的可以表示随机变量 x 每增加一个单位时随机变量 y 的平均增长量吗? 三、问题辨析 先看题三:某种产品的广告费支出 x 与销售额 y(单位:百万元)之间有如 下对应数据: X 2 4 5 6 8 y 30 40 60 50 70 如果 x 与 y 具有线性相关关系, 求线性回方程,并说明 b 的意义。(选自三点一测) 答案:=5,=50,=1380,=145,b==6.5,a=-b=50-6.5*5=17.5, 于是所求的线性回归方程为:y=17.5+6.5x , b=6.5 表示广告费每增加一百万元,销售额增加 6.5 百万元。 上表是通过统计的方式得到的两组离散变量,从中无论如何也得不出广告费 每增加一百万元,销售额增加 6.5 百万元这一结论,并且销售额增长的平均值也 不是 6.5。那么对总体中这两组变量是否存在这一变化规律呢?我们知道线性回 归方程与选择的样本有关,样本变了 b 的值就变了,而总体中销售额增长的平均 值应是一个定值。其实线性相关只是说两组变量之间的关系近似一条直线(回归 直线),而本例关于 b 的意义完全套用直线斜率 k 的意义,这显然不恰当。如果 题一认同 A)、D)是错误答案,那么 B)也不正确,准确说法应为:销售额平 均提高约 6.5 百万元。平均值是一个唯一确定的值,平均并不代表模糊近似。到 此我们也清楚了题二答案的错误实质就是把线性相关完全等同于函数关系了。 一、错误已成习惯

随手翻看手头资料,类似错误随处可见,比如 题四:设有一个回归方程y=2-1.5X,则变量×增加一个单位时() A)y平均增加1.5个单位:)y平均增加2个单位: C)y平均减少1.5个单位:D)y平均减少2个单位: 题五:己知一个线性回归方程为y=2-1.5x,当变量×增加一个单位时,则变 量y平均减少 个单位。 这类题在很多资料中较带见,学生做起来轻松自然,很难发现问题,做多了 就变得模糊不清,碰到题一和题二就难以自圆其说。看来这己不是资料粗糙的问 题,而是编者、学者甚至教者己形成错误习惯,有一种约定速成的趋势。其实细 看资料也不乏细致之处,比如 题六:已知一个线性回归方程为y=0.5x-0.81,则x=25时,y的估计值为 一·(选自三点一测)该题就很好地注意到这个问题。本文题一编题者 就是想强调和挖据这一知识点,因此我们有必要澄清并统一说法,以免题目自相 矛盾,造成学生糊里糊涂
随手翻看手头资料,类似错误随处可见,比如 题四:设有一个回归方程 y=2-1.5x,则变量 x 增加一个单位时 ( ) A) y 平均增加 1.5 个单位; B) y 平均增加 2 个单位; C) y 平均减少 1.5 个单位; D) y 平均减少 2 个单位; 题五:已知一个线性回归方程为 y=2-1.5x,当变量 x 增加一个单位时,则变 量 y 平均减少_________个单位。 这类题在很多资料中较常见,学生做起来轻松自然,很难发现问题,做多了 就变得模糊不清,碰到题一和题二就难以自圆其说。看来这已不是资料粗糙的问 题,而是编者、学者甚至教者已形成错误习惯,有一种约定速成的趋势。其实细 看资料也不乏细致之处,比如 题六:已知一个线性回归方程为 y=0.5x-0.81,则 x=25 时,y 的估计值为 _________.(选自三点一测)该题就很好地注意到这个问题。本文题一编题者 就是想强调和挖掘这一知识点,因此我们有必要澄清并统一说法,以免题目自相 矛盾,造成学生糊里糊涂