变量间的相关关系讲义 基础知识梳理 知识点1:变量之间的相关关系 两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。当自变量取值一定时,因变量也确 定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。相关关系是 种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数 学成绩好坏与物理成绩的关系等都是相关关系 注意:两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近 则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相 关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系。 点睛:两个变量相关关系与函数关系的区别和联系 相同点:两者均是两个变量之间的关系,不同点:函数关系是一种确定的关系,如匀速直线运动中时间t与路程 s的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变 量之间的关系,而相关关系是非随机变量与随机变量之间的关系:函数关系式一种因果关系,而相关关系不一定 是因果关系,也可能是伴随关系。 知识点2散点图. 1在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点 就组成了变量之间的一个图,通常称这种图为变量之间的散点图 2从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条 光滑的曲线来近似,这种近似的过程称为曲线拟合。 3对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的的值也由小变大,这种相关称为正相 关,正相关时散点图的点散布在从左下角到由上角的区域内。 如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散步在从 左上角到右下角的区域 注意:画散点图的关键是以成对的一组数据,分别为此点的横、纵坐标,在平面直角坐标系中把其找出来,其横 纵坐标的单位长度的选取可以不同,应考虑数据分布的特征,散点图只是形象的描述点的分布,如果点的分布大 致呈一种集中趋势,则两个变量可以初步判断具有相关关系,如图中数据大致分布在一条直线附近,则表示的关 系是线性相关,如果两个变量统计数据的散点图呈现如下图所示的情况,则两个变量之间不具备相关关系,例如 学生的身高和学生的英语成绩就没有相关关系。 点睛ε散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反 映变量统计关系的一种图形。特点是能直观表现出影响因素和预测对象之间的总体关系趋势。优点是能通过直观 醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系。散点图不仅 可传递变量间关系类型的信息,也能反映变量间关系的明确程度 知识点3:回归直线 (1)回归直线的定义 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线 叫做回归直线 (2)回归直线的特征
1 变量间的相关关系讲义 一、基础知识梳理 知识点 1:变量之间的相关关系 两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。当自变量取值一定时,因变量也确 定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。相关关系是 一种非确定性关系,如长方体的高与体积之间的关系就是确定的函数关系,而人的身高与体重的关系,学生的数 学成绩好坏与物理成绩的关系等都是相关关系。 注意:两个变量之间的相关关系又可分为线性相关和非线性相关,如果所有的样本点都落在某一函数曲线的附近, 则变量之间具有相关关系(不确定性的关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相 关关系,相关关系只说明两个变量在数量上的关系,不表明他们之间的因果关系,也可能是一种伴随关系。 点睛:两个变量相关关系与函数关系的区别和联系 相同点:两者均是两个变量之间的关系,不同点:函数关系是一种确定的关系,如匀速直线运动中时间 t 与路程 s 的关系,相关关系是一种非确定的关系,如一块农田的小麦产量与施肥量之间的关系,函数关系是两个随机变 量之间的关系,而相关关系是非随机变量与随机变量之间的关系;函数关系式一种因果关系,而相关关系不一定 是因果关系,也可能是伴随关系。 知识点 2.散点图. 1.在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们常将变量所对应的点描出来,这些点 就组成了变量之间的一个图,通常称这种图为变量之间的散点图。 2.从散点图可以看出如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条 光滑的曲线来近似,这种近似的过程称为曲线拟合。 3.对于相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的的值也由小变大,这种相关称为正相 关,正相关时散点图的点散布在从左下角到由上角的区域内。 如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,负相关时散点图的点散步在从 左上角到右下角的区域。 注意:画散点图的关键是以成对的一组数据,分别为此点的横、纵坐标,在平面直角坐标系中把其找出来,其横 纵坐标的单位长度的选取可以不同,应考虑数据分布的特征,散点图只是形象的描述点的分布,如果点的分布大 致呈一种集中趋势,则两个变量可以初步判断具有相关关系,如图中数据大致分布在一条直线附近,则表示的关 系是线性相关,如果两个变量统计数据的散点图呈现如下图所示的情况,则两个变量之间不具备相关关系,例如 学生的身高和学生的英语成绩就没有相关关系。 点睛:散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反 映变量统计关系的一种图形。特点是能直观表现出影响因素和预测对象之间的总体关系趋势。优点是能通过直观 醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系。散点图不仅 可传递变量间关系类型的信息,也能反映变量间关系的明确程度 知识点 3:回归直线 (1)回归直线的定义 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线 叫做回归直线。 (2)回归直线的特征
如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚的了解对应两个变量之间的相关 性,就像平均数可以作为一个变量的数据的代表一样,这条直线也可以作为两个变量之间具有相关关系的代表。 (3)回归直线方程 一般地,设x与y是具有相关关系的两个变量,且相应n组观测值的n个点(xy)(i=1,2 n)大致分布在 条直线的附近,求在整体上与这n个点最接近的一条直线,设此直线方程为y=bx+a,这里的y在上方加上 “∧”是为了区分实际值y,表示当x取值xy相应的观察值y而直线上对应于x的纵坐标是y=bx+a 点睛:1)散点图中的点整体上分布在一条直线附近时,可以应用线性回归分析的方法分析数据 2)回归直线是反映:“从整体上看,各点与此直线的距离的和最小”的一条直线,它反映了具有线性相关关系的 两个变量之间的规律; 3)我们可以通过回归直线方程,由一个变量的值来推测另一个变量的值,解决生活中的实际问题;这种方法称 为回归方法 知识点4:回归系数公式及相关问题 最小二乘法:求回归直线的关键是如何用数学的方法刻画从整体上看,各点与此直线的距离最小,假设我们已 经得到两个具有线性相关关系的变量的一组数据:(x1,y)(x2,y2)…(xn,yn)。当自变量x取x1(i=1,2,… n)时,可以得到j=bx+a(i=1,2,……,n),它与实际收集到的y之间的偏差是y-=y-(bx1+a)(i=1 n)这样用n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。总的偏差为∑(y-j), 偏差有正有负,易抵消,所以采用绝对值∑-到,由于带绝对值计算不方便所以换成平方, Q=∑0-i)=0--03+-0+--0++b0①现在的问题就归结为:当a,b取什么值时Q最小,即点到 直线y=bx+a的整体距离最小 (x-x)(y2-y)∑xy-nxy ②(其中 x y)这种通过求①式的最小值而得到回归 ∑(x-x) a=y-b 直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法。 2回归直线方程的求法 ①先判断变量是否线性相关 ②若线性相关,利用公式计算出a,b ③利用回归方程对生活实际问题进行分析与预测 注意:①线性回归直线方程中x的系数是b,常数项是a,与直线的斜截式不大一样, ②如果散点图中的点分布从整体上看不在任何一条直线附近,这时求出的线性回归方程实用价值不大 点睛:线性回归方程:一般地设有n个观察数据如下: X 当ab使ρ=(x-bx-a)2+(y2-b-a)2+…+(,-b-a)取得最小值时,就称=bx+a为拟合这n对数据的线性回归
2 如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚的了解对应两个变量之间的相关 性,就像平均数可以作为一个变量的数据的代表一样,这条直线也可以作为两个变量之间具有相关关系的代表。 (3)回归直线方程 一般地,设 x 与 y 是具有相关关系的两个变量,且相应 n 组观测值的 n 个点(xi,yi)(i=1,2,…,n)大致分布在 一条直线的附近,求在整体上与这 n 个点最接近的一条直线,设此直线方程为 y bx a ˆ = + ,这里的 y 在上方加上 “ ”是为了区分实际值 y,表示当 x 取值 xi,y 相应的观察值 yi 而直线上对应于 xi,的纵坐标是 y bx a ˆ = + 点睛:1)散点图中的点整体上分布在一条直线附近时,可以应用线性回归分析的方法分析数据; 2)回归直线是反映:“从整体上看,各点与此直线的距离的和最小”的一条直线,它反映了具有线性相关关系的 两个变量之间的规律; 3)我们可以通过回归直线方程,由一个变量的值来推测另一个变量的值,解决生活中的实际问题;这种方法称 为回归方法 知识点 4:回归系数公式及相关问题 1.最小二乘法:求回归直线的关键是如何用数学的方法刻画从整体上看,各点与此直线的距离最小,假设我们已 经得到两个具有线性相关关系的变量的一组数据: 1 1 ( , ) x y 2 2 ( , ) x y ……( , ) n n x y 。当自变量 x 取 i x ( i =1,2,……, n)时,可以得到 ˆ i y bx a = + ( i =1,2,……,n),它与实际收集到的 i y 之间的偏差是 ˆ ( ) i i i i y y y bx a − = − + ( i =1, 2,……,n)这样用 n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。总的偏差为 1 ( ) ˆ n i i i y y = − , 偏差有正有负,易抵消,所以采用绝对值 1 ˆ n i i i y y = − ,由于带绝对值计算不方便所以换成平方, 2 2 2 2 2 1 1 2 2 3 3 1 ( ) ( ) ( ) ( ) ( ) ˆ n i i n n i Q y y y bx a y bx a y bx a y bx a = = − = − − + − − + − − + + − − ①现在的问题就归结为:当 a ,b 取什么值时 Q 最小,即点到 直线 y=bx+a 的整体距离最小 1 1 2 2 2 1 1 ( )( ) ( ) n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx = = = = − − − = = − − = − ②(其中 1 1 n i i x x n = = , 1 1 n i i y y n = = ) 这种通过求①式的最小值而得到回归 直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法。 2.回归直线方程的求法 ①先判断变量是否线性相关 ②若线性相关,利用公式计算出 a,b ③利用回归方程对生活实际问题进行分析与预测 注意:①线性回归直线方程中 x 的系数是 b,常数项是 a,与直线的斜截式不大一样, ②如果散点图中的点分布从整体上看不在任何一条直线附近,这时求出的线性回归方程实用价值不大。 点睛:线性回归方程:一般地,设有 n 个观察数据如下: x 1 x 2 x 3 x … n x y 1 y 2 y 3 y … n y 当 a,b 使 2 2 2 1 1 2 2 ( ) ( ) ... ( ) Q y bx a y bx a y bx a = − − + − − + + − − n n 取得最小值时,就称 y bx a ˆ = + 为拟合这 n 对数据的线性回归
方程,该方程所表示的直线称为回归直线 知识点5:线性回归分析思想在实际中的应用 教材中利用回归直线对年龄与脂肪的关系做了上述分析,这种分析方法叫做线性回归分析。利用这种分析方法可 以对生活中的很多问题进行分析与预测 求线性回归方程的步骤:计算平均数xy:计算x与y的积,求∑xy,:计算∑x2:将结果代入公式求a 用b=j-a求b;写出回归方程 注意:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数ab的计算公式,算 出ab.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误。 知识点6:利用相关系数判断线性相关程度 最小二乘法求出回归直线的方程后,可以对上面两个变量的关系进行分析与预测,如图 a……… 1r 1r--0呂4 前两个是线性相关,可以求回归方程,后两个是非线性相关,直线不能很好地反映图中两个变量之间的关系。显 然求回归直线的方程是没有意义的。有些变量线性相关,有些非线性相关,衡量变量的线性相关程度引入一个量: 相关系数 ∑(x-x)y-y) 注意它的符号:当r>0时,x,y正相关,当r<0时,x,y负相关,统计学认为:对于r,若r∈[-1,-075那 么负相关很强,若r∈[0.75],那么正相关很强若r∈(-0.75,-030]或r∈[0.30,0.75),那么相关性一般, 若r∈[-025,0.25],那么相关性较弱 点睛:相关系数的绝对值越大,线性相关关系就越强。 常考题型例解 知识点1 例1:下列两个变量之间是相关关系的是() 圆的面积与半径 B、球的体积与半径 C、角度与它的正弦值 D、一个考生的数学成绩与物理成绩 思路分析:由题意知A表示圆的面积与半径之间的关系S=πr2,B表示球的体积与半径之间的关系p=4x3 表示角度与它的正弦值y=sina,前面所说的都是确定的函数关系,相关关系不是确定的函数关系,故选D
3 方程,该方程所表示的直线称为回归直线 知识点 5:线性回归分析思想在实际中的应用 教材中利用回归直线对年龄与脂肪的关系做了上述分析,这种分析方法叫做线性回归分析。利用这种分析方法可 以对生活中的很多问题进行分析与预测, 求线性回归方程的步骤:计算平均数 x, y ;计算 i i x 与y 的积,求 i i x y ;计算 2 i x ;将结果代入公式求 a ; 用 b = y − ax 求 b ;写出回归方程 注意:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数 a,b 的计算公式,算 出 a b, .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误。 知识点 6:利用相关系数判断线性相关程度 最小二乘法求出回归直线的方程后,可以对上面两个变量的关系进行分析与预测,如图 前两个是线性相关,可以求回归方程,后两个是非线性相关,直线不能很好地反映图中两个变量之间的关系。显 然求回归直线的方程是没有意义的。有些变量线性相关,有些非线性相关,衡量变量的线性相关程度引入一个量: 相关系数 1 2 2 1 1 ( )( ) ( ) ( ) n i i i n n i i i j x x y y r x x y y = = = − − = − − 注意它的符号:当 r 0 时,x,y 正相关,当 r 0 时,x,y 负相关,统计学认为:对于 r,若 r − − 1, 0.75 那 么负相关很强,若 r 0.75,1 ,那么正相关很强若 r − − ( 0.75, 0.30或r 0.30,0.75 ) ,那么相关性一般, 若 r − 0.25,0.25 ,那么相关性较弱, 点睛:相关系数的绝对值越大,线性相关关系就越强。 二、常考题型例解 易---------------------知识点 1 例 1:下列两个变量之间是相关关系的是( ) A、圆的面积与半径 B、球的体积与半径 C、角度与它的正弦值 D、一个考生的数学成绩与物理成绩 思路分析:由题意知 A 表示圆的面积与半径之间的关系 S=πr 2,B 表示球的体积与半径之间的关系 3 4 3 r v = C 表示角度与它的正弦值 y=sinα,前面所说的都是确定的函数关系,相关关系不是确定的函数关系,故选 D.
点拨:本题考查变量间的相关关系,判断两个变量间的关系还是函数关系还是相关关系的关键是判断两个变量之 间的关系是否是确定的,若确定的则是函数关系;若不确定,则是相关关系 例2:名师出高徒可以解释为老师的水平越高,学生的水平也越高,那么教师与学生的水平之间有何种关系呢? 你能举出更多的描述生活中两变量相关关系的成语与俗语吗?至少写两个 思略分析:名师出高徒的意思是有名的教师一定能教出高明的徒弟,高水平教师有很大趋势教出高水平的学生, 实际学生成绩的好坏还与很多因素有关,如学生的天赋,学生的努力,学习的环境等,所以它们之间的关系带有 不确定性即为相关关系。 解:教师的水平与学生的水平之间具有相关关系 生活中描述两个变量之间的相关关系的成语或俗语还有:老子英雄儿好汉,强将手下无弱兵,虎父无犬子 2009·宁夏高考中知识点2 例3.对变量x、y有观测数据(x;,y;)(i=1,2,…,10),得散点图1;对变量u,v有观测数据(u,v)(i=1 10),得散点图2.由这两个散点图可以判断() A、变量x与y正相关,u与v正相关 B、变量x与y正相关,u与v负相关 C、变量x与y负相关,u与v正相关 D、变量x与y负相关,u与v负相关 思路分析:由题图1可知,y随x的增大而减小,各点整体呈递减趋势,x与y负相关, 由题图2可知,u随ⅴ的增大而增大,各点整体呈递增趋势,u与ⅴ正相关 点拨:本题考査散点图,是通过读图来解决问题,考查读图能力,是一个基础题,本题可以粗略的反应两个变量 间的关系,是不是线性相关,是正相关还是负相关 易知识点3 例4:5个学生的数学和物理成绩如下表: 学生 E 数学 物理 由散点图判断它们是否相关,是正相关还是负相关? 思路分析:分别以数学和物理成绩作为横纵坐标建立直角坐标系,描点画出散点图,然后根据散点图判断 解:以x轴表示数学成绩,y轴表示物理成绩可得到相应的散点图,如图所示 y物理成绩 05060708090数学成绩 由散点图可知,两者之间具有相关关系,且为正相关 例5:下表为某地近几年机动车辆数与交通事故数的统计资料 机动车辆数x/千台95110412101291351504180 交通事故数y/千件621757N4858749.8410213
4 解:D 点拨:本题考查变量间的相关关系,判断两个变量间的关系还是函数关系还是相关关系的关键是判断两个变量之 间的关系是否是确定的,若确定的则是函数关系;若不确定,则是相关关系. 例 2:名师出高徒可以解释为老师的水平越高,学生的水平也越高,那么教师与学生的水平之间有何种关系呢? 你能举出更多的描述生活中两变量相关关系的成语与俗语吗?至少写两个。 思路分析:名师出高徒的意思是有名的教师一定能教出高明的徒弟,高水平教师有很大趋势教出高水平的学生, 实际学生成绩的好坏还与很多因素有关,如学生的天赋,学生的努力,学习的环境等,所以它们之间的关系带有 不确定性即为相关关系。 解:教师的水平与学生的水平之间具有相关关系 生活中描述两个变量之间的相关关系的成语或俗语还有:老子英雄儿好汉,强将手下无弱兵,虎父无犬子 2009•宁夏高考中 知识点 2 例 3.对变量 x、y 有观测数据(xi,yi)(i=1,2,…,10),得散点图 1;对变量 u,v 有观测数据(ui,vi)(i=1, 2,…,10),得散点图 2.由这两个散点图可以判断( ) A、变量 x 与 y 正相关,u 与 v 正相关 B、变量 x 与 y 正相关,u 与 v 负相关 C、变量 x 与 y 负相关,u 与 v 正相关 D、变量 x 与 y 负相关,u 与 v 负相关 思路分析:由题图 1 可知,y 随 x 的增大而减小,各点整体呈递减趋势,x 与 y 负相关, 由题图 2 可知,u 随 v 的增大而增大,各点整体呈递增趋势,u 与 v 正相关. 解:C 点拨:本题考查散点图,是通过读图来解决问题,考查读图能力,是一个基础题,本题可以粗略的反应两个变量 之间的关系,是不是线性相关,是正相关还是负相关 易知识点 3 例 4:5 个学生的数学和物理成绩如下表: 由散点图判断它们是否相关,是正相关还是负相关? 思路分析:分别以数学和物理成绩作为横纵坐标建立直角坐标系,描点画出散点图,然后根据散点图判断。 解:以 x 轴表示数学成绩,y 轴表示物理成绩可得到相应的散点图,如图所示 由散点图可知,两者之间具有相关关系,且为正相关. 例 5:下表为某地近几年机动车辆数与交通事故数的统计资料
请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程:如果不 具有线性相关关系,说明理由 思路分析:根据表中数据画出散点图,观察数据是否集中,判断变量之间关系,再利用最小二乘法计算系数ab 写出线性回归方程 在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.计算相应的数据 之和: ∑x=10312=16∑x=17852 将它们代入(*)式计算得b≈0.0774,a=-1.0241,所以,所求线性回归方程为y=0.0774x-1.0241 知识点4 例6:有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计得到了一个热饮杯数与当天 气温之间的线性关系,其回归方程为y=-2.35x+147.77.如果某天气温为-2℃时,则该小卖部大约能卖出热饮 的杯数是() B、143 C、152 思路分析:∵一个热饮杯数与当天气温之间的线性关系,其回归方程为y^=-2.35x+147.77 如果某天气温为-2℃时,即x=2, 则该小卖部大约能卖出热饮的杯数y=235x(-2)+14777=15247=152 例7:某县教研室要分析学生初中升学的数学成绩对高一年级数学成绩有什么影响,在高一年级学生中随机抽选 10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩(如下表): 学生编号 入学成绩x63677588 高一期末成绩y (1)对变量x与y进行相关性检验,如果x与y之间具有线性相关关系,求出线性回归方程; (2)若某学生入学数学成绩是80分,试估测他高一期末数学考试成绩 思路分析:(1)根据所给的数据利用最小二乘法.写出线性回归方程的系数和a的值,写出线性回归方程,注意 运算过程中不要出错 (2)将x=80代入所求出的线性回归方程中,得y=8分,即这个学生的高一期末数学考试成绩预测值为84分 解:(1)设所求的线性回归方程为y=ax+b 63+67+75+88+85 =75.6 5 65+77+80+82+92 最小二乘法可以写出 663×65+67×77+75×80+88×82+85×92-5×766×79230b042 3969+4489+5625+7744+7225-5×571536
5 请判断机动车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不 具有线性相关关系,说明理由. 思路分析:根据表中数据画出散点图,观察数据是否集中,判断变量之间关系,再利用最小二乘法计算系数 a,b 写出线性回归方程 解: 在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.计算相应的数据 之和: 8 8 8 8 2 1 1 1 1 1031, 71.6, 137835, 9611.7 i i i i i i i i i x y x x y = = = = = = = = , 将它们代入( )式计算得 b a = − 0.0774, 1.0241 ,所以,所求线性回归方程为 y x = − 0.0774 1.0241. 知识点 4 例 6:有一位同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计得到了一个热饮杯数与当天 气温之间的线性关系,其回归方程为 y^=-2.35x+147.77.如果某天气温为-2℃时,则该小卖部大约能卖出热饮 的杯数是( ) A、140 B、143 C、152 D、156 思路分析:∵一个热饮杯数与当天气温之间的线性关系,其回归方程为 y^=-2.35x+147.77. 如果某天气温为-2℃时,即 x=-2, 则该小卖部大约能卖出热饮的杯数 y=-2.35×(-2)+147.77=152.47≈152 解:C. 例 7:某县教研室要分析学生初中升学的数学成绩对高一年级数学成绩有什么影响,在高一年级学生中随机抽选 10 名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩(如下表): (1)对变量 x 与 y 进行相关性检验,如果 x 与 y 之间具有线性相关关系,求出线性回归方程; (2)若某学生入学数学成绩是 80 分,试估测他高一期末数学考试成绩 思路分析:(1)根据所给的数据利用最小二乘法.写出线性回归方程的系数和 a 的值,写出线性回归方程,注意 运算过程中不要出错. (2)将 x=80 代入所求出的线性回归方程中,得 y=8 分,即这个学生的高一期末数学考试成绩预测值为 84 分 解:(1)设所求的线性回归方程为 y=ax+b 最小二乘法可以写出
a=23.108 因此所求的线性回归方程y=0.742x+23.108 (2)将x=80代入所求出的线性回归方程中, 得y=84分,即这个学生的高一期末数学考试成绩预测值为84分 点拨:利用回归方程可以对总体进行预测估计,回归方程将部分观测值所反映的规律进行延伸,使我们对有线性 相关关系的两个变量进行分析和控制,依据自变量的取值估计和预报因变量的值,在现实生活中有广泛的应用 知识点5 例8:某种产品的广告费用支出x万元与销售额y万元之间有如下的对应数据 2030 505O (1)根据上表提供的数据,求出y关于x的线性回归方程 (2)据此估计广告费用为10万元时,所得的销售收入 2x2=14,2=120 解:(1)x 2+4+5+6+8 5 20+30+50+50+70 2x}2=2+4+52+6+82=145 X∥1=2×20+4×30+5×50+6×50+8×70=1270 X沙1-58y1270-5×5×44 145-5×25 a=y-bx=44-8.5x5=1.5 回归直线方程为y=8.5x+1.5 (2)当x=10时 预报y的值为y=85×10+1.5=865 知识点6 例9:一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小 时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果: 转速x(转秒 8 每小时生产有缺点的零件数y(件 (1)利用散点图或相关系数r的大小判断变量y对x是否线性相关?为什么? (2)如果y对x有线性相关关系,求回归直线方程 (3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内? (最后结果精确到0001.参考数据:√656.25≈25617, 16×11+14×9+12×8+8×5=438,162+142+122+82=660,112+92+82+52=291) 思路分析:(1)利用所给的数据做出两个变量的相关系数,得到相关系数趋近于1,得到两个变量具有线性相关 关系
6 因此所求的线性回归方程 y=0.742x+23.108 (2)将 x=80 代入所求出的线性回归方程中, 得 y=84 分,即这个学生的高一期末数学考试成绩预测值为 84 分 点拨:利用回归方程可以对总体进行预测估计,回归方程将部分观测值所反映的规律进行延伸,使我们对有线性 相关关系的两个变量进行分析和控制,依据自变量的取值估计和预报因变量的值,在现实生活中有广泛的应用 知识点 5 例 8:某种产品的广告费用支出 x 万元与销售额 y 万元之间有如下的对应数据: (1)根据上表提供的数据,求出 y 关于 x 的线性回归方程; (2)据此估计广告费用为 10 万元时,所得的销售收入 知识点 6 例 9:一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小 时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果: (1)利用散点图或相关系数 r 的大小判断变量 y 对 x 是否线性相关?为什么? (2)如果 y 对 x 有线性相关关系,求回归直线方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为 10 个,那么机器的运转速度应控制在什么范围内? (最后结果精确到 0.001.参考数据: 656.25 25.617 , 16×11+14×9+12×8+8×5=438,162+142+122+82=660,112+92+82+52=291) 思路分析:(1)利用所给的数据做出两个变量的相关系数,得到相关系数趋近于 1,得到两个变量具有线性相关 关系.
(2)先做出横标和纵标的平均数,做出利用最小二乘法求线性回归方程的系数的量,做出系数,求出a,写出 线性回归方程 (3)根据上一问做出的线性回归方程,使得函数值小于或等于10,解出不等式 解:(1)x=12.5,y=8.25,(x1-x)1-y)=25.5 +-201-=62-2567 广=0.995>0.75,y与有线性性相关关系 (2)2(xi b=0.728571, a=y-bX=-0.857138 回归直线方程为:y=0.729X0857 〔3〕由上一问可知0.729×-0.857≤10, 解得x≤14893 三、典例方法详析 考点1:相关关系 方法:两个变量间的关系。相关关系是一种非确定的关系,也不一定是因果关系。如产品销售额与广告费的投入 关系。 例10:下面哪些变量是相关关系 A、出租车费与行驶的里程B、房屋面积与房屋价格 C、人的身高与体重 D、铁块的大小与质量 思路分析:由出租车费与行驶的里程、房屋面积与房屋价格和铁块的大小与质量知它们都是确定的函数关系,故 A、B、C不对,根据经验知人的身高会影响体重但不是唯一因素,故是相关关系.从而得出正确答案 解:A、由出租车费与行驶的里程的公式知,是确定的函数关系,故A不对 B、房屋面积与房屋价格,是确定的函数关系,故B不对; C、人的身高会影响体重,但不是唯一因素,故C对 D、铁块的大小与质量,是确定的函数关系故D不对 故选C 考点2:散点图 方法:根据所给数据分别作为点的横纵坐标在直角坐标系内描点,画图。 例11某研究小组在一项实验中获得一组数据,将其整理得到如图所示的散点图,下列函数中,最能近似刻画y 与t之间关系的是() 4.5 0123456789101112131415161718 思略分析ε根据所给的散点图,观察出图象在第一象限,单调递増,并且增长比较缓慢,一般用对数函数来模拟
7 (2)先做出横标和纵标的平均数,做出利用最小二乘法求线性回归方程的系数的量,做出系数,求出 a,写出 线性回归方程. (3)根据上一问做出的线性回归方程,使得函数值小于或等于 10,解出不等式. 三、典例方法详析 考点 1:相关关系 方法:两个变量间的关系。相关关系是一种非确定的关系,也不一定是因果关系。如产品销售额与广告费的投入 关系。 例 10:下面哪些变量是相关关系( ) A、出租车费与行驶的里程 B、房屋面积与房屋价格 C、人的身高与体重 D、铁块的大小与质量 思路分析:由出租车费与行驶的里程、房屋面积与房屋价格和铁块的大小与质量知它们都是确定的函数关系,故 A、B、C 不对,根据经验知人的身高会影响体重但不是唯一因素,故是相关关系.从而得出正确答案. 解:A、由出租车费与行驶的里程的公式知,是确定的函数关系,故 A 不对; B、房屋面积与房屋价格,是确定的函数关系,故 B 不对; C、人的身高会影响体重,但不是唯一因素,故 C 对; D、铁块的大小与质量,是确定的函数关系故 D 不对. 故选 C. 考点 2:散点图 方法:根据所给数据分别作为点的横纵坐标在直角坐标系内描点,画图。 例 11:某研究小组在一项实验中获得一组数据,将其整理得到如图所示的散点图,下列函数中,最能近似刻画 y 与 t 之间关系的是( ) A、y=2t B、y=2t2 C、y=t3 D、y=log2t 思路分析:根据所给的散点图,观察出图象在第一象限,单调递增,并且增长比较缓慢,一般用对数函数来模拟
选项中只有一个底数是2的对数函数, 综合技能提升 考点3:回归方程 方法:利用最小二乘法的思想,根据线性回归方程系数公式建立回归方程,估计和预测取值,从而获得对两个变 量之间整体关系的了解。 例12.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x的一组数据如表所示 x51015203040500 y(微,)610111316171923 (1)画出数据的散点图 (2)根据散点图,你能得出什么结论? (3)求回归方程 思路分析:(1)由图表可以知道有(5,6)(10,10)(15,11)(20,13)(30,16)(40,17)(50,19)(60, 23)点的坐标,在坐标系中描出点的坐标,得到散点图 (2)散点图呈带状分布,x与y是具有相关关系的两个变量,且对应n组观测值的n个点大致分布在一条直线 附近 (3)计算得r=0979307992>0.75.x与y有很强的线性相关关系,做出横标和纵标的平均数,利用最小二乘法 做出回归直线方程的系数,得到回归直线方程 解:(1)由图表可以知道有(5,6)(10,10)(15,11)(20,13) (30,16)(40,17)(50,19)(60,23), 在坐标系中得到散点图如图所示 (2)结论:x与y是具有相关关系的两个变量,且对应n组观测值的n个点大致分布在一条直线附近 其中整体上与这n个点最接近的一条直线最能代表变量x与y之间的关系, (3)计算得r=0.979307992>0.75 x与y有很强的线性相关关系, X=5+10+15+20+30+40+50+608=28.75 y=6+10+11+13+16+17+19+23 由计算器计算得a~=6616438≈662 b=0.269863≈0.27, ∴y^=662+0.27x 四、学法对应题练 1、下列选项中,两个变量具有相关关系的是( A、正方形的面积与周长 B、匀速行驶车辆的行驶路程与时间 C、人的身高与体重 D、人的身高与视力 分析:由正方形的面积与周长的公式和匀速直线运动的路程公式知它们都是确定的函数关系,故A、B不对,根 据经验知人的身高会影响体重但不是唯一因素,故是相关关系;人的身高与视力无任何关系,故选C 2、下列变量关系是相关关系的是() ①家庭的经济条件与学生的学习成绩之间的关系 ②教师的执教水平与学生的学习成绩之间的关系 ③学生的身高与学生的学习成绩之间的关系 学生的学习态度与学习成绩之间的关系 A、①②B、①③C、②③D、②④ 分析:对于①,家庭的经济条件与学生的学习成绩之间的关系没有关系,所以①不是:对于②,教师的执教水平 与学生的学习成绩之间的有关系,但不确定;是相关关系,所以②是;对于③,学生的身高与学生的学习成绩之 间没有关系:所以③不是:对于④,学生的学习态度与学习成绩之间有关系,但关系不确定;所以是相关关系
8 在选项中只有一个底数是 2 的对数函数, 解:D. 综合技能提升 考点 3:回归方程 方法:利用最小二乘法的思想,根据线性回归方程系数公式建立回归方程,估计和预测取值,从而获得对两个变 量之间整体关系的了解。 例 12.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度 y 与腐蚀时间 x 的一组数据如表所示: (1)画出数据的散点图; (2)根据散点图,你能得出什么结论? (3)求回归方程. 思路分析:(1)由图表可以知道有(5,6)(10,10)(15,11)(20,13)(30,16)(40,17)(50,19)(60, 23)点的坐标,在坐标系中描出点的坐标,得到散点图. (2)散点图呈带状分布,x 与 y 是具有相关关系的两个变量,且对应 n 组观测值的 n 个点大致分布在一条直线 附近. (3)计算得 r=0.979307992>0.75.x 与 y 有很强的线性相关关系,做出横标和纵标的平均数,利用最小二乘法 做出回归直线方程的系数,得到回归直线方程. 解:(1)由图表可以知道有(5,6)(10,10)(15,11)(20,13) (30,16)(40,17)(50,19)(60,23), 在坐标系中得到散点图如图所示 (2)结论:x 与 y 是具有相关关系的两个变量,且对应 n 组观测值的 n 个点大致分布在一条直线附近, 其中整体上与这 n 个点最接近的一条直线最能代表变量 x 与 y 之间的关系. (3)计算得 r=0.979307992>0.75. x 与 y 有很强的线性相关关系, x¯=5+10+15+20+30+40+50+60 8=28.75 y¯=6+10+11+13+16+17+19+23 8=14.25 由计算器计算得 a^=6.616438≈6.62, b^=0.269863≈0.27, ∴ y^=6.62+0.27x. 四、学法对应题练 1、下列选项中,两个变量具有相关关系的是( ) A、正方形的面积与周长 B、匀速行驶车辆的行驶路程与时间 C、人的身高与体重 D、人的身高与视力 分析:由正方形的面积与周长的公式和匀速直线运动的路程公式知它们都是确定的函数关系,故 A、B 不对,根 据经验知人的身高会影响体重但不是唯一因素,故是相关关系;人的身高与视力无任何关系,故选 C. 2、下列变量关系是相关关系的是( ) ①家庭的经济条件与学生的学习成绩之间的关系 ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④学生的学习态度与学习成绩之间的关系. A、①② B、①③ C、②③ D、②④ 分析:对于①,家庭的经济条件与学生的学习成绩之间的关系没有关系,所以①不是;对于②,教师的执教水平 与学生的学习成绩之间的有关系,但不确定;是相关关系,所以②是;对于③,学生的身高与学生的学习成绩之 间没有关系;所以③不是;对于④,学生的学习态度与学习成绩之间有关系,但关系不确定;所以是相关关系
所以④是.故选D 学法指导 考查了两个变量之间具有相关关系的定义,根据学过公式和经验进行逐项验证,一定要和函数关系区别出来 3.在画两个变量的散点图时,下面哪个叙述是正确的() A、预报变量x轴上,解释变量y轴上 B、解释变量x轴上,预报变量y轴上 C、可以选择两个变量中任意一个变量x轴上D、可以选择两个变量中任意一个变量y轴上 分析:∵通常把自变量称为解析变量,因变量称为预报变量,∴故解释变量为自变量,预报变量为因变量.故选 4.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量ⅹ(吨)与相应的生产能耗y(吨标准煤) 的几组对照数据 E=sae 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=b^x+a^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100 吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×25+4×3+5×4+6×45=665) 解:〔1)根据题意,作图可得, 〔2)由系数公式可知, x=4.5, 66.5-4×4.5×3.566 =0.7 86-4×4.5 5 6543210 =3.5-0.7×==0.35 所以线性回归方程为y=07x+0.35 0 〔3)x=100时,y=0.7x+0.35=70.35 所以预生产100吨甲产品的生产能耗比技术改造前降低1965吨标准煤 学法指导 本题考査散点图,是通过读图来解决问题,考查读图能力,是一个基础题,本题可以粗略的反应两个变量之间的 关系,是不是线性相关,是正相关还是负相关 5(2010·临颍县)已知回归直线斜率的估计值是1.23,样本平均数x=4,y=5,则该回归直线方程为( A、y^=1.23x+4 y^=1.23x+0.08C 0.08x+1.23 1.23x+5 思路分析:根据回归直线斜率的估计值是123,得到线性回归方程是y=123X+b,根据横标和纵标的值得到样 本中心点,把中心点代入方程求出b的值 解答:解:∵回归直线斜率的估计值是123,∴线性回归方程是y=1.23X+b ∵样本平均数x=4,y=5,∴样本中心点是(4,5)∴5=123×4+a∴a=0.08, 线性回归方程是y=123x+0.08,故选B 点评:本题考查线性回归方程的写法,解题的关键是知道线性回归直线一定过样本中心点,把样本中心点代入求 出b的值,注意数字的运算 6、某种产品的广告费支出x与销售额y(单位:万元)之间有如下对应数据:
9 所以④是.故选 D. 学法指导 考查了两个变量之间具有相关关系的定义,根据学过公式和经验进行逐项验证,一定要和函数关系区别出来. 3.在画两个变量的散点图时,下面哪个叙述是正确的( ) A、预报变量 x 轴上,解释变量 y 轴上 B、解释变量 x 轴上,预报变量 y 轴上 C、可以选择两个变量中任意一个变量 x 轴上 D、可以选择两个变量中任意一个变量 y 轴上 分析:∵通常把自变量称为解析变量,因变量称为预报变量,∴故解释变量为自变量,预报变量为因变量.故选 B 4. 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤) 的几组对照数据. (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 y=b^x+a^; (3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤.试根据(2)求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 学法指导 本题考查散点图,是通过读图来解决问题,考查读图能力,是一个基础题,本题可以粗略的反应两个变量之间的 关系,是不是线性相关,是正相关还是负相关. 5(2010•临颍县)已知回归直线斜率的估计值是 1.23,样本平均数 x¯=4,y¯=5,则该回归直线方程为( ) A、y^=1.23x+4 B、 y^=1.23x+0.08 C、 y^=0.08x+1.23 D、 y^=1.23x+5 思路分析:根据回归直线斜率的估计值是 1.23,得到线性回归方程是 y=1.23x+b,根据横标和纵标的值得到样 本中心点,把中心点代入方程求出 b 的值. 解答:解:∵回归直线斜率的估计值是1.23,∴线性回归方程是 y=1.23x+b ∵样本平均数 x¯=4,y¯=5,∴样本中心点是(4,5)∴5=1.23×4+a∴a=0.08, ∴线性回归方程是 y=1.23x+0.08,故选 B. 点评:本题考查线性回归方程的写法,解题的关键是知道线性回归直线一定过样本中心点,把样本中心点代入求 出 b 的值,注意数字的运算. 6、某种产品的广告费支出 x 与销售额 y(单位:万元)之间有如下对应数据:
广告费茹出x24568 销售额y3040605070 (Ⅰ)画出散点图 (Ⅱ)求回归直线方程; (Ⅲ)试预测广告费支出为10万元时,销售额多大? 思路分析:本题考察的知识点是散点图及回归直线方程的求法 (1)根据表中数据描点即可得到散点图 (2)由表中数据,我们不难求出x,y的平均数,及xi2的累加值,及xiyi的累加值,代入回归直线系数计算公 式,即可求出回归直线方程. (3)将预报值10万元代入回归直线方程,解方程即可求出相应的销售额 解:(Ⅰ)根据表中所列数据可得散点图如下: (Ⅱ)x=2+4+5+6+8 y=30+40+50+60+70 又已知∑i=15x2=145,∑i=15xiy=1380 于是可得:b^=i=1>5xiy-xyi=1∑5x2-5x-2=1380-5×5×50145-5×5×5=65 y-b^x=50-6.5×6=175 因此,所求回归直线方程为:y=6.5X+17.5 (Ⅲ)根据上面求得的回归直线方程,当广告费支出为10万元时 y=65×10+17.5=82.5(万元) 即这种产品的销售收入大约为825万元 点拨:用二分法求回归直线方程的步骤和公式要求大家熟练掌握,线性回归方程必过样本中心点(x,y).是两 个系数之间的纽带,希望大学注意 学法指导 本题考査散点图,考査从散点图观察两个变量之间的相关关系,考査线性回归直线方程的写法,是一个综合题, 运算量比较大,注意像这种考运算的问题不要出错
10 (Ⅰ)画出散点图; (Ⅱ)求回归直线方程; (Ⅲ)试预测广告费支出为 10 万元时,销售额多大? 思路分析:本题考察的知识点是散点图及回归直线方程的求法, (1)根据表中数据描点即可得到散点图. (2)由表中数据,我们不难求出 x,y 的平均数,及 xi2 的累加值,及 xiyi 的累加值,代入回归直线系数计算公 式,即可求出回归直线方程. (3)将预报值 10 万元代入回归直线方程,解方程即可求出相应的销售额. 解:(Ⅰ)根据表中所列数据可得散点图如下: (Ⅱ) x¯=2+4+5+6+8 5=5, y¯=30+40+50+60+70 5=50 又已知 ∑i=15xi2=145, ∑i=15xiyi=1380. 于是可得: b^=i=1∑5xiyi-x¯y¯i=1∑5xi2-5x-2= 1380-5×5×50 145-5×5×5=6.5 a^=y¯-b^x¯=50-6.5×6=17.5 因此,所求回归直线方程为: ŷ=6.5x+17.5 (Ⅲ)根据上面求得的回归直线方程,当广告费支出为 10 万元时, ŷ=6.5×10+17.5=82.5(万元) 即这种产品的销售收入大约为 82.5 万元 点拨:用二分法求回归直线方程的步骤和公式要求大家熟练掌握,线性回归方程必过样本中心点(x¯,y¯).是两 个系数之间的纽带,希望大学注意. 学法指导 本题考查散点图,考查从散点图观察两个变量之间的相关关系,考查线性回归直线方程的写法,是一个综合题, 运算量比较大,注意像这种考运算的问题不要出错.