变量间的相关关系 高一数学 2014年12月8日
高一数学 变量间的相关关系 2014年12月8日
本节课内容 1、相关关系 2、回归分析 3、散点图 4、正相关、负相关 5、线性相关 6、回归直线 7、最小二乘法 8、回归方程
本节课内容 1、相关关系 2、回归分析 3、散点图 4、正相关、负相关 5、线性相关 6、回归直线 7、最小二乘法 8、回归方程
变量之间的相关关系 变量之间也存在很多关系,看下面的例子 1、公鸡打鸣与太阳升起 2、数学成绩与物理成绩 3、龙生龙、凤生凤、老鼠儿子打地洞(生物意义上解释) 4、y=2x+1中,y与x的关系 5、三角形三边长与三角形面积的关系 6、父亲和儿子的身高体重 7、你是学数学的?那你很聪明哦。 这些变量之间的关系,你能分类说明吗?
变量之间的相关关系 变量之间也存在很多关系,看下面的例子 1、公鸡打鸣与太阳升起 2、数学成绩与物理成绩 3、龙生龙、凤生凤、老鼠儿子打地洞(生物意义上解释) 4、y=2x+1中,y与x的关系 5、三角形三边长与三角形面积的关系 6、父亲和儿子的身高体重 7、你是学数学的?那你很聪明哦。 这些变量之间的关系,你能分类说明吗?
变量之间的相关关系 确定关系:(3)(4)(5) 个量确定,另一个也确定 特殊确定关系:函数关系 相关关系:(1)(2)6)(7) 两个变量是有关联的,但关系不确定 著名案例:吸烟与肺癌有关? 常见的说法:数学好,物理肯定没有问题 客观现象之间存在的互相依存关系叫相关关系,全 称为统计相关关系,两个特点 1.现象之间确实存在着数量上的依存关系 2.现象之间数量上的关系是不确定、不严格的依存关系
变量之间的相关关系 确定关系:(3)(4)(5) 一个量确定,另一个也确定 特殊确定关系:函数关系 相关关系:(1)(2)(6)(7) 两个变量是有关联的,但关系不确定 著名案例:吸烟与肺癌有关? 常见的说法:数学好,物理肯定没有问题 客观现象之间存在的互相依存关系叫相关关系,全 称为统计相关关系,两个特点: 1.现象之间确实存在着数量上的依存关系 2.现象之间数量上的关系是不确定、不严格的依存关系
回归分析 对具有相关关系的两个变量进行统计分析的方法叫 做回归分析。通俗地讲,回归分析就是寻找相关关 系中非确定关系的某种确定性
回归分析 对具有相关关系的两个变量进行统计分析的方法叫 做回归分析。通俗地讲,回归分析就是寻找相关关 系中非确定关系的某种确定性
线性相关—最简单的相关关系 在一次对人体脂肪含量和年龄关系的研究,获得了 组样本数据 年龄23273941454950 脂肪9.517.821225.927.5263282 年龄53545657586061 脂肪29.630231430.8335352346 其中各年龄对应的脂肪数据是这个年龄人群脂肪含量 的样本平均数 思考1:年龄与脂肪含量有没有关系?依据是什么? 思考2:有没有更加定量的分析方法,进行定量研究?
线性相关——最简单的相关关系 在一次对人体脂肪含量和年龄关系的研究,获得了 一组样本数据: 其中各年龄对应的脂肪数据是这个年龄人群脂肪含量 的样本平均数. 年龄 23 27 39 41 45 49 50 脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2 年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6 思考1:年龄与脂肪含量有没有关系?依据是什么? 思考2:有没有更加定量的分析方法,进行定量研究?
二票 35 散点图 30 在平面直角坐标系 15 中,表示具有相关 10F◆ 关系的两个变量的 20253035404550556065年龄 组数据图形,称 为散点图 上例中散点图从左下角到右上角,即一个变量从 小到大变化时,另一个变量小大到大变化。这种 关系称为正相关关系。否则称为负相关关系。 思考1:上述散点图能否给我们的思考1提供理论支持? 思考2:上述散点图还有什么样的特点?
散点图 0 5 1 0 1 5 2 0 2 5 3 0 3 5 4 0 2 0 2 5 3 0 3 5 4 0 4 5 5 0 5 5 6 0 6 5 年龄 脂肪含量 在平面直角坐标系 中,表示具有相关 关系的两个变量的 一组数据图形,称 为散点图 ► 上例中散点图从左下角到右上角,即一个变量从 小到大变化时,另一个变量小大到大变化。这种 关系称为正相关关系。否则称为负相关关系。 思考1:上述散点图能否给我们的思考1提供理论支持? 思考2:上述散点图还有什么样的特点?
回归直线 若散点图中各点大致分布在一条直线附近,就称这两 个变量具有线性相关关系,这条直线叫做回归直线 显然根据不同标准可以画出不同直线来近似表示这种 线性关系。那么在这众多的直线中哪个(或哪些)最 能表示这种线性关系? 考虑两点:合理性和操作性 各点与直线的整体偏差最小,实际值与理论上值得偏 差最小
回归直线 若散点图中各点大致分布在一条直线附近,就称这两 个变量具有线性相关关系,这条直线叫做回归直线 显然根据不同标准可以画出不同直线来近似表示这种 线性关系。那么在这众多的直线中哪个(或哪些)最 能表示这种线性关系? 考虑两点:合理性和操作性 各点与直线的整体偏差最小,实际值与理论上值得偏 差最小
最小二乘法 使得样木数据的点 到回归直线的距离平方和最小的方法 y=bXa (x-x)(y-5)∑xy-nxj b y-bx ∑(x,-x)2 nX i=1 回归直线方程是否过定点?你知道是哪个点吗? j=bx+a,a=j-b代入得=bx+y-b=b(x-x)+j 所以回归直线方程过点x,y
最小二乘法 回归直线方程是否过定点?你知道是哪个点吗? 使得样本数据的点 到回归直线的距离平方和最小的方法。 1 1 2 2 2 1 1 ( )( ) , ( ) n n i i i i i i n n i i i i x x y y x y nx y b a y bx x x x nx = = = = − − − = = = − − − ( , ). ˆ , , ˆ ( ) , x y y bx a a y bx y bx y bx b x x y 所以回归直线方程过点 = + = − 代入得 = + − = − +
线性回归方程计算步骤 第一步,计算平均数x下 高考不允许使用 计算器,为了减 2∑x∑x2 少计算错误,建 第二步,求和之 议采用列表的方 ∑(x-x(y-元)∑x- 式分步计算 第三步,计算 a=y- a+bx 第m止 2 n X n yiyI my x2xnx22……xnn∑x
线性回归方程计算步骤 第一步,计算平均数 第二步,求和 第三步,计算 第四步,写出回归方程 x y 1 n i i i x y = 2 1 n i i x = 1 1 2 2 2 1 1 ( )( ) , ( ) n n i i i i i i n n i i i i x x y y x y nx y b a y bx x x x nx = = = = − − − = = = − − − y ˆ = a + bx 高考不允许使用 计算器,为了减 少计算错误,建 议采用列表的方 式分步计算 i 1 2 …… n xi x1 x2 …… xn yi y1 y2 …… yn xiyi x1y1 x2y2 …… xnyn xi 2 x1 2 x2 2 …… xn 2 x y 1 n i i i x y = 2 1 n i i x =