课题:变量的相关性与统计案例 考纲要求: ①会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关 关系. ②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线 性回归方程 ③独立性检验了解独立性检验(只要求列联表)的基本思想、方法及 其简单应用 ④回归分析了解回归分析的基本思想、方法及其简单应用 ⑤了解上述常见的统计方法,并能应用这些方法解决一些实际问题 教材复习 两类变量关系类型:函数关系和相关关系 正相关与负相关: 如果一个变量的值由小变大时,另一个变量的值也由小变大,这种 相关称为正相关 如果一个变量的值由小变大时,另一个变量的值却由大变小这种相 关称为负相关 利用散点图判断正、负相关: ①如果散点图中的点散布在从左下角到右上角的区域内,称为正相关; ②如果散点图中的点散布在从左上角到右下角的区域内,称为负相关 回归直线:设和是具有相关关系的两个变量,且对应于个观测值的个 点大致分布在一条直线的附近,若所求的直线方程为,其中是回归方程 的斜率,是截距,其中 (1)求回归直线方程的一般步骤 ①作散点图,判断散点是否在一条直线附近 ②如果散点在一条直线附近,利用公式计算,,并写出回归直线方程, ③利用回归方程,由一个变量的值,预测或控制另一个变量的取值 (1)对于变量与随机抽取到的对数据样本相关系数 (2)r具有以下性质: ①当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关 ②当|r|≤1,并且|r|越接近1时,两个变量的线性相关程度越强; 当|r越接近0时,两个变量的线性相关程度越弱; (3)相关性检验的步骤 ①作统计假设②根据小概率与在附表中找出的一个临界值 ③根据样本相关系数计算公式算出值 用统计判断, 独立性检验 列联表:为了研究事件与的关系,经调査得到一张列联表,如下表所示
课题:变量的相关性与统计案例 考纲要求: ①会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关 关系. ②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线 性回归方程. ③独立性检验 了解独立性检验(只要求列联表)的基本思想、方法及 其简单应用. ④回归分析 了解回归分析的基本思想、方法及其简单应用. ⑤了解上述常见的统计方法,并能应用这些方法解决一些实际问题. 教材复习 两类变量关系类型:函数关系和相关关系. 正相关与负相关: 如果一个变量的值由小变大时,另一个变量的值也由小变大,这种 相关称为正相关; 如果一个变量的值由小变大时,另一个变量的值却由大变小这种相 关称为负相关. 利用散点图判断正、负相关: ①如果散点图中的点散布在从左下角到右上角的区域内,称为正相关; ②如果散点图中的点散布在从左上角到右下角的区域内,称为负相关 回归直线: 设和是具有相关关系的两个变量,且对应于个观测值的个 点大致分布在一条直线的附近,若所求的直线方程为,其中是回归方程 的斜率,是截距,其中 (1)求回归直线方程的一般步骤: ①作散点图,判断散点是否在一条直线附近. ②如果散点在一条直线附近,利用公式计算, ,并写出回归直线方程, ③利用回归方程,由一个变量的值,预测或控制另一个变量的取值. ⑴对于变量与随机抽取到的对数据样本相关系数 ⑵r具有以下性质: ①当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关; ②当|r|≤1,并且|r|越接近1时,两个变量的线性相关程度越强; 当|r|越接近0时,两个变量的线性相关程度越弱; ⑶相关性检验的步骤: ① 作统计假设 ② 根据小概率与在附表中找出的一个临界值 ③ 根据样本相关系数计算公式算出值 ④ 用统计判断, 独立性检验 列联表:为了研究事件与的关系,经调查得到一张列联表,如下表所示
合 统计中有一个有用的(读做〃卡方〃)统计量,它的表达式是 经过对统计量分布的研究,已经得到了两个临界值:,与 当根据具体的数据算出的时,有的把握说事件与有关 当时,有的把握说事件与有关; 当时,有的把握说事件与有关 基本知识方法 通过散点图只能大致判断两个变量是否具有相关关系,相关程度的大小 取决于相关系数的大小 求回归直线是一种有固定的程序的〃算法〃,在解题中要严格按步骤完 成 回归方程的作用在于预测或控制另一个变量的取值,有很强的应用价 回归和相关都是研究两个变量相互关系的分析方法。相关分析研究两个 变量之间相关的方向和相关的密切程度.但是相关分析不能指出两变量 相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变 化关系。回归方程则是通过一定的数学方程来反映变量之间相互关系的 具体形式,以便从一个已知量来推测另一个未知量。为估算预测提供 个重要的方法 典例分析 考点一变量的相关关系的判定 问题1.(山东济南)下面变量是线性相关的是 人的身高与视力角的大小与所对的圆弧长收入水平与纳税水平人的年龄 与身高 02346 图2 (海南)对变量Ⅹ,y有观测数据理力争(,)(主=1,2,…,10 得散点图1;对变量u,有观测数据(,)(i=1,2,…,10),得散 点图2.由这两个散点图可以判断
合计 合计 统计中有一个有用的(读做“卡方”)统计量,它的表达式是 经过对统计量分布的研究,已经得到了两个临界值:,与. 当根据具体的数据算出的时,有的把握说事件与有关; 当时,有的把握说事件与有关; 当时,有的把握说事件与有关. 基本知识方法 通过散点图只能大致判断两个变量是否具有相关关系,相关程度的大小 取决于相关系数的大小. 求回归直线是一种有固定的程序的“算法”, 在解题中要严格按步骤完 成. 回归方程的作用在于预测或控制另一个变量的取值,有很强的应用价 值. 回归和相关都是研究两个变量相互关系的分析方法。相关分析研究两个 变量之间相关的方向和相关的密切程度.但是相关分析不能指出两变量 相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变 化关系。回归方程则是通过一定的数学方程来反映变量之间相互关系的 具体形式,以便从一个已知量来推测另一个未知量。为估算预测提供一 个重要的方法. 典例分析: 考点一 变量的相关关系的判定 问题1.(山东济南)下面变量是线性相关的是 人的身高与视力角的大小与所对的圆弧长收入水平与纳税水平人的年龄 与身高 (海南)对变量x, y 有观测数据理力争(,)(i=1,2,…,10), 得散点图1;对变量u ,v 有观测数据(,)(i=1,2,…,10),得散 点图2. 由这两个散点图可以判断
变量X与y正相关,u与V正相关变量x与y正相关,u与V负 相关 变量与y负相关,u与v正相关变量x与y负相关,u与V负 相关 考点二线性回归分析 问题2.(全国新课标)在一组样本数据(x1,y1),(x2,y2), ,(xnyn)(n≥2,x1-x2…,xn不全相等)的散点图中,若所有样本 点(x,y)(=1,2,…m)都在直线 上,则这组样本数据的样本相关系数为 (陕西)设,…,是变量和的个样本点,直线是由这些样本点通过最小 乘法得到的线性回归方程(如图),以下结论中正确的是 和的相关系数为直线的斜率 和的相关系数在到之间 当为偶数时,分布在两侧的样本点的个数一定相同; 直线过点
变量x 与y 正相关,u 与v 正相关 变量x 与y 正相关,u 与v 负 相关 变量x 与y 负相关,u 与v 正相关 变量x 与y 负相关,u 与v 负 相关 考点二 线性回归分析 问题2.(全国新课标)在一组样本数据(x1,y1),(x2,y2), …,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本 点(xi,yi)(i=1,2,…,n)都在直线 上,则这组样本数据的样本相关系数为 (陕西)设,…,是变量和的个样本点,直线是由这些样本点通过最小 二乘法得到的线性回归方程(如图),以下结论中正确的是 和的相关系数为直线的斜率; 和的相关系数在到之间; 当为偶数时,分布在两侧的样本点的个数一定相同; 直线过点
(湖南)设某大学的女生体重(单位:)与身高(单位:)具有线性相 关关系,根据一组样本数据(,)(,灬,),用最小二乘法建立的回 归方程为,则下列结论中不正确的是 与具有正的线性相关关系; 回归直线过样本点的中心( 若该大学某女生身高增加,则其体重约增加; 若该大学某女生身高为,则可断定其体重比为 (山东)某产品的广告费用与销售额的统计数据如下表 广告费用(万元) 销售额(万元) 根据上表可得回归方程中的为,据此模型预报广告费用为万元时销售额 为万元 万元 万元 万元 问题3,(广东)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 (吨)与相应的生产能耗(吨标准煤)的几组对照数据 请画出上表数据的散点图 请根据上表提供的数据,用最小二乘法求出关于的线性回归方程 已知该厂技改前吨甲产品的生产能耗为吨标准煤.试根据求出的线性回归方程,预测生产吨甲 产品的生产能耗比技改前降低多少吨标准煤 (参考数值:)
(湖南)设某大学的女生体重(单位:)与身高(单位:)具有线性相 关关系,根据一组样本数据(,)(,…,),用最小二乘法建立的回 归方程为,则下列结论中不正确的是 与具有正的线性相关关系; 回归直线过样本点的中心( , ); 若该大学某女生身高增加,则其体重约增加; 若该大学某女生身高为,则可断定其体重比为. (山东)某产品的广告费用与销售额的统计数据如下表: 广告费用(万元) 销售额(万元) 根据上表可得回归方程中的为,据此模型预报广告费用为万元时销售额 为 万元 万元 万元 万元 问题3.(广东)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 (吨)与相应的生产能耗(吨标准煤)的几组对照数据. 请画出上表数据的散点图; 请根据上表提供的数据,用最小二乘法求出关于的线性回归方程; 已知该厂技改前吨甲产品的生产能耗为吨标准煤.试根据求出的线性回归方程,预测生产吨甲 产品的生产能耗比技改前降低多少吨标准煤? (参考数值:)
考点三独立性检验 问题早.(辽宁)电视传媒公司为了解某地区电视观众对某类体育节 目的收视情况,随机抽取了名观众进行调査.下面是根据调査结果绘制 的观众日均收看该体育节目时间的频率分布直方图:
考点三 独立性检验 问题4.(辽宁)电视传媒公司为了解某地区电视观众对某类体育节 目的收视情况,随机抽取了名观众进行调查.下面是根据调查结果绘制 的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于分钟的观众称为“体育迷〃。 根据已知条件完成下面的 列联表,并据此资料你是否认为“体育迷〃与性别有关? 非体育迷体育迷合计 男女 合计 将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采 用随机抽样方法每次抽取名观众,抽取次,记被抽取的名观众中的〃体 育迷〃人数为 若每次抽取的结果是相互独立的,求 的分布列,期望 和方差 0.050.01 3.8416.635
将日均收看该体育节目时间不低于分钟的观众称为“体育迷”。 根据已知条件完成下面的 列联表,并据此资料你是否认为“体育迷“与性别有关? 非体育迷 体育迷 合计 男 女 合计 将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采 用随机抽样方法每次抽取名观众,抽取次,记被抽取的名观众中的“体 育迷“人数为 .若每次抽取的结果是相互独立的,求 的分布列,期望 和方差 附: , 0.05 0.01 3.841 6.635
走向高考 (湖南)通过随机询问名性别不同的大学生是否爱好某项运动,得到如 下的列联表: 男|女总计1由算得 附表 爱好402060 0.0500.0100.001 不爱好203050 3.84116.63510.828 总 50110 参照附表,得到的正确结论是 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关″ 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关〃 有以上的把握认为“爱好该项运动与性别有关〃 有以上的把握认为“爱好该项运动与性别有关〃 (福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事 先拟定的价格进行试销,得到如下数据: (元) 销量 (件) 求回归直线方程 其中 预计在今后的销售中,销量与单价仍然服从中的关系,且该产品的成本 是元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利 润=销售收入一成本)
男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 走向高考: (湖南)通过随机询问名性别不同的大学生是否爱好某项运动,得到如 下的列联表: 由算得 附表: 0.050 0.010 0.001 3.841 6.635 10.828 参照附表,得到的正确结论是 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关” 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关” 有以上的把握认为“爱好该项运动与性别有关” 有以上的把握认为“爱好该项运动与性别有关” (福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事 先拟定的价格进行试销,得到如下数据: 单价 (元) 销量 (件) 求回归直线方程 ,其中 ; 预计在今后的销售中,销量与单价仍然服从中的关系,且该产品的成本 是元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利 润=销售收入—成本)