第七章相关关系分析法 (相关与回归) 教学内容 1.相关关系的概念、种类、相关关系分析的主要内容 2.简单线形相关分析方法 3.简单直线回归方程的配合方法 4.判定系数、估计标准误差的含义、计算及其应用 5.曲线回归方程、多元线性回归方程的配合方法 6.其它相关系数的含义、计算及应用场合 教学重点 1.简单线形相关分析方法 2.简单直线回归方程的配合方法 3.判定系数、估计标准误差的含义、计算及其应用 教学难点:相关系数的计算、回归方程的配合、估计标准误差的计算及其应用 授课学时:7学时 第一节相关关系分析概述 一、相关关系的的概念 现实中,任何现象的存在都不是孤立的,它们是互相联系,彼此制约的。 例如在家庭收入和消费支出之间,施肥量与粮食收获量之间,广告费支出与商品 销售额之间等等,无不存在着一定的关系。现象之间的相互关系归纳起来可以区 分为两种不同的类型:一种是函数关系(确定性关系),另一种是相关关系(非 确定性关系)。 函数关系:指变量之间存在着严格的依存关系,在这种关系中,当自变量 取定一个数值时,因变量会有一个完全确定的值和它对应。如图1-1所示。 或对于某一变量的每一个数值,另一变量都会有唯一确定的值与之相对应, 并且这种关系可用一个数学表达式反映出来。 如圆的面积=圆周率×半径2 距离=速度×时间(在匀速条件下) 销售额=销售量×销售价格(价格一定时)
1 第七章 相关关系分析法 (相关与回归) 教学内容: 1.相关关系的概念、种类、相关关系分析的主要内容 2.简单线形相关分析方法 3.简单直线回归方程的配合方法 4.判定系数、估计标准误差的含义、计算及其应用 5.曲线回归方程、多元线性回归方程的配合方法 6.其它相关系数的含义、计算及应用场合 教学重点: 1.简单线形相关分析方法 2.简单直线回归方程的配合方法 3.判定系数、估计标准误差的含义、计算及其应用 教学难点:相关系数的计算、回归方程的配合、估计标准误差的计算及其应用. 授课学时:7 学时 第一节 相关关系分析概述 一、相关关系的的概念 现实中,任何现象的存在都不是孤立的,它们是互相联系,彼此制约的。 例如在家庭收入和消费支出之间,施肥量与粮食收获量之间,广告费支出与商品 销售额之间等等,无不存在着一定的关系。现象之间的相互关系归纳起来可以区 分为两种不同的类型:一种是函数关系(确定性关系),另一种是相关关系(非 确定性关系)。 函数关系:指变量之间存在着严格的依存关系,在这种关系中,当自变量 取定一个数值时,因变量会有一个完全确定的值和它对应。如图 1-1 所示。 或对于某一变量的每一个数值,另一变量都会有唯一确定的值与之相对应, 并且这种关系可用一个数学表达式反映出来。 如圆的面积=圆周率×半径 2 距离=速度×时间(在匀速条件下) 销售额=销售量×销售价格(价格一定时)
图1-1 相关关系:指现象之间确实存在的、但关系值不固定的相互依存关系。或现 象之间客观存在的不确定的数量依存关系。 即变量之间确实存在着一定的相互关系,在这种关系中,当一个现象发生 数量变化时,另一现象也相应地发生数量变化,但其关系值是不固定的(不唯 的),一个变量取定一个值时,另一个变量会有若干数值与之相对应,这些数值 之间表现出一定的波动性,但又总是围绕着它们的平均数而上下波动的。如图 1-2所示。 例如,粮食亩产量与施肥量之间存在一定的关系,但在同样的施肥量下, 每亩粮食产量可能出现不同的数值,并不存在严格的依存关系。因为对每亩耕地 的产量来说,它不仅和施肥量有关,而且还取决于种子的品质,密植程度,耕作 深度,土地的贫瘠程度,降雨量等,这就造成了在同样的施肥量下,其亩产量也 并不完全相等。亩产量与施肥量的这种关系称为相关关系。 又如,某种日用品的销售量与当地居民的人口数有一定的关系,人口愈多 销售量越大,但不能说两个地区的人口相等,销售量也就相等,这里很难给出 个确切的关系,日用品的销售量还和居民的收入水平、消费水平、消费习惯等有 关。这种日用品的销售量与居民人口数之间的关系也属于相关关系
2 · · · · · · · x y · 图 1-1 相关关系:指现象之间确实存在的、但关系值不固定的相互依存关系。或现 象之间客观存在的不确定的数量依存关系。 即变量之间确实存在着一定的相互关系,在这种关系中,当一个现象发生 数量变化时,另一现象也相应地发生数量变化,但其关系值是不固定的(不唯一 的),一个变量取定一个值时,另一个变量会有若干数值与之相对应,这些数值 之间表现出一定的波动性,但又总是围绕着它们的平均数而上下波动的。如图 1-2 所示。 例如,粮食亩产量与施肥量之间存在一定的关系,但在同样的施肥量下, 每亩粮食产量可能出现不同的数值,并不存在严格的依存关系。因为对每亩耕地 的产量来说,它不仅和施肥量有关,而且还取决于种子的品质,密植程度,耕作 深度,土地的贫瘠程度,降雨量等,这就造成了在同样的施肥量下,其亩产量也 并不完全相等。亩产量与施肥量的这种关系称为相关关系。 又如,某种日用品的销售量与当地居民的人口数有一定的关系,人口愈多, 销售量越大,但不能说两个地区的人口相等,销售量也就相等,这里很难给出一 个确切的关系,日用品的销售量还和居民的收入水平、消费水平、消费习惯等有 关。这种日用品的销售量与居民人口数之间的关系也属于相关关系
身高与体重之间的关系是非常密切的,但身高1.75米的人可以表现为许多 不同的体重等。 广告费投资与商品销售量之间有一定的关系,但是,在广告费投入相等的情 况下,商品销售量不一定相等。 图1-2 在各种生产活动和经济过程中,许多经济的、技术的因素之间都存在着这 种相关关系 从程度上、数量上、种类上分析现象之间相关关系的理论和方法就称为相 关关系分析法 二、相关关系的种类 现象之间的相互关系是很复杂的。它们各以不同的方向,不同的程度相互 作用着,并表现出不同的类型。 (一)按相关的程度分为:完全相关、不完全相关和不相关 完全相关:两种现象之间,其中一个现象的数量变化完全由另一个现象的 数量变化所确定,则这两种现象之间的关系为完全相关。在这种情况下,相关关 系即成为函数关系,也可以说函数关系是相关关系的一个特例 如圆面积=πr2 销售额=销售量×价格(价格固定) 不相关:若两种现象之间彼此互不影响,其数量变化各自独立,则为不相 关。或:一种现象的数量变化完全不受另一现象数量变化的影响,则称这两种现 象为不相关。如原油储存量与生产工人的出勤率是无关的,棉纱纤维长度与工人
3 身高与体重之间的关系是非常密切的,但身高 1.75 米的人可以表现为许多 不同的体重等。 广告费投资与商品销售量之间有一定的关系,但是,在广告费投入相等的情 况下,商品销售量不一定相等。 图 1-2 在各种生产活动和经济过程中,许多经济的、技术的因素之间都存在着这 种相关关系。 从程度上、数量上、种类上分析现象之间相关关系的理论和方法就称为相 关关系分析法。 二、相关关系的种类 现象之间的相互关系是很复杂的。它们各以不同的方向,不同的程度相互 作用着,并表现出不同的类型。 (一)按相关的程度分为:完全相关、不完全相关和不相关 完全相关:两种现象之间,其中一个现象的数量变化完全由另一个现象的 数量变化所确定,则这两种现象之间的关系为完全相关。在这种情况下,相关关 系即成为函数关系,也可以说函数关系是相关关系的一个特例。 如圆面积=πr 2 销售额=销售量×价格(价格固定) 不相关:若两种现象之间彼此互不影响,其数量变化各自独立,则为不相 关。或:一种现象的数量变化完全不受另一现象数量变化的影响,则称这两种现 象为不相关。如原油储存量与生产工人的出勤率是无关的,棉纱纤维长度与工人 · · · · · · · · · x y
人数多少是无关的等。 不完全相关:若两种现象之间的关系介于完全相关和不相关之间,则称其 为不完全相关。若现象之间的相关点分布远离函数关系,表明两变量之间的相关 关系很小;若两个变量之间的分布很接近于函数关系,就说明两个变量之间的相 关关系很密切。 一般的相关现象都是指这种不完全相关,它是相关关系分析的研究对象。 (二)、按变量之间相关关系的方 正相关 向分(按相关的性质分) 负相关 正相关:当一个变量ⅹ的值增加(或减少),另一个变量y的值也随之增加 (或减少),二者是同方向变动的,这种相关关系成为正相关。 或:两个相关现象之间,当一种现象的数量由小(大)变大(小),另一个 现象的数量也相应地由小(大)变大(小),则称其为正相关。 例如,家庭的消费支出随着收入的增加而增加;随着技术水平的提高,产品 合格率也不断提高;收入水平(y)与受教育程度(x)之间的关系;商品的消费量(y) 与居民收入(x)之间的关系等。 负相关:当一个变量ⅹ的值增加(减少)时,另一个变量y的值随之减少 (增加),二者是反方向变动的,这种相关关系成为负相关。 或当一种现象的数量由小(大)变大(小),而另一种现象的数量相反地由 大(小)变小(大),则称其为负相关 例,商品流转的规模越大,单位流通费用越低;劳动生产率水平提高,单位 产品成本随之下降;样本的单位数越多,抽样误差愈小;物价越高与消费量越少 等等。 正相关、负相关若用散点图表示,分别如图1-3中的(1)、(2)。 (1)
4 人数多少是无关的等。 不完全相关:若两种现象之间的关系介于完全相关和不相关之间,则称其 为不完全相关。若现象之间的相关点分布远离函数关系,表明两变量之间的相关 关系很小;若两个变量之间的分布很接近于函数关系,就说明两个变量之间的相 关关系很密切。 一般的相关现象都是指这种不完全相关,它是相关关系分析的研究对象。 (二)、按变量之间相关关系的方 向分(按相关的性质分) 正相关 负相关 正相关:当一个变量 x 的值增加(或减少),另一个变量 y 的值也随之增加 (或减少),二者是同方向变动的,这种相关关系成为正相关。 或:两个相关现象之间,当一种现象的数量由小(大)变大(小),另一个 现象的数量也相应地由小(大)变大(小) ,则称其为正相关。 例如,家庭的消费支出随着收入的增加而增加;随着技术水平的提高,产品 合格率也不断提高;收入水平(y)与受教育程度(x)之间的关系;商品的消费量(y) 与居民收入(x)之间的关系等。 负相关:当一个变量 x 的值增加(减少)时,另一个变量 y 的值随之减少 (增加),二者是反方向变动的,这种相关关系成为负相关。 或当一种现象的数量由小(大)变大(小),而另一种现象的数量相反地由 大(小)变小(大),则称其为负相关。 例,商品流转的规模越大,单位流通费用越低;劳动生产率水平提高,单位 产品成本随之下降;样本的单位数越多,抽样误差愈小;物价越高与消费量越少 等等。 正相关、负相关若用散点图表示,分别如图 1-3 中的(1)、(2)。 (1) (2)
图1-3 直线相关 (三)按相关的形式分 曲线相关 直线相关:当一个变量发生增减变动时,另一变量随之发生大体均等的增减 变动,在图形上这种变动关系近似地表现为一条直线(y增长量大致相同) 或一种现象的一个数值和另一种现象相应的数值,在平面坐标系中确定为 个点,称为散点(或相关点),若相关点大致分布在一条直线的周围,则为直线 相关。如图1-3中的(1)、(2) 曲线相关:当一个变量发生变动时,另一变量的值也随之发生变动,但这 种变动是不均等的,在图形上,其观察点分布在各种不同的曲线周围。或现象相 关点的分布表现为各种不同的曲线形式,如图1-4中(3)、(4)。 88 4 图 (四)按研究变量 单相关(一元相关) 的多少分 复相关(多元相关) 单相关:两个变量之间的相关关系为单相关。例如收入额与消费支出额之间 的关系 复相关:三个或三个以上变量之间的相关关系称为复相关。 如:同时研究商品的销售额、广告费支出、居民收入水平之间的关系;研究 某种商品的需求量与价格水平及人们的收入水平之间的关系 实际工作中,若存在多个自变量对一个因变量的关系,可以抓住其中最主要 的因素研究其相关关系
5 图 1-3 直线相关:当一个变量发生增减变动时,另一变量随之发生大体均等的增减 变动,在图形上这种变动关系近似地表现为一条直线(y 增长量大致相同)。 或一种现象的一个数值和另一种现象相应的数值,在平面坐标系中确定为一 个点,称为散点(或相关点),若相关点大致分布在一条直线的周围,则为直线 相关。如图 1-3 中的(1)、(2) 曲线相关:当一个变量发生变动时,另一变量的值也随之发生变动,但这 种变动是不均等的,在图形上,其观察点分布在各种不同的曲线周围。或现象相 关点的分布表现为各种不同的曲线形式,如图 1-4 中(3)、(4)。 图 1-4 (四)按研究变量 的多少分 单相关(一元相关) 复相关(多元相关) 单相关:两个变量之间的相关关系为单相关。例如收入额与消费支出额之间 的关系。 复相关:三个或三个以上变量之间的相关关系称为复相关。 如:同时研究商品的销售额、广告费支出、居民收入水平之间的关系;研究 某种商品的需求量与价格水平及人们的收入水平之间的关系。 实际工作中,若存在多个自变量对一个因变量的关系,可以抓住其中最主要 的因素研究其相关关系。 (三)按相关的形式分 直线相关 曲线相关 (3) (4)
、相关关系分析的主要内容(任务) 相关关系分析的目的在于研究现象之间相互依存关系的形式及密切程度 并用一定的数学形式把这种关系反映出来,为统计估算和预测提供重要的依据和 方法。具体包括: (一)确定经济现象之间是否存在相关关系及相关关系的种类。经济现象间 有无相关关系是能否运用相关关系分析法的前提。确定经济现象之间有无相关关 系的方法有两种:一是作定性判断,它是从经济现象之间的本质联系着手,根据 有关的理论及实践经验进行分析研究来判断的;二是绘制相关图表 (二)确定经济现象之间相关关系的密切程度 当经济现象之间存在相关关系时,就要测定它们之间关系的密切程度,为进 步分析研究问题提供依据。 确定现象之间相关关系密切程度的方法是:绘制相关图和计算相关系数。相 关图对相关关系的密切程度可以得出粗略的判断,而相关系数能从数量上对经济 现象之间的相关程度做出明确的反映 (三)建立经济现象之间数量变动关系的数学方程式(确定相关关系的数学 表达式) 为了测定现象之间数量变化上的一般关系,必须使用函数关系的数学公式作 为相关关系的数学表达式,称为回归方程,用以说明自变量发生变动时,因变量 平均来说会发生多大的变化。 (四)确定因变量估计值误差的程度 根据变量之间变动关系的数学方程式可以计算出各个因变量的估计值,这 些估计值与实际值之间肯定有差异,差异小,表示推算结果的准确度高;差异大, 准确度低。而准确度的高低又关系到回归方程的实用价值。所以相关分析还要测 定因变量估计值和实际值之间差异的大小,用以反映因变量估计值的准确程度。 这种用来反映因变量估计值准确程度的指标叫估计标准误差。 第二节简单直线相关分析 是否存在相关关系 简单直线相关分析内容 相关关系的种类 相关关系的密切程度
6 三、相关关系分析的主要内容(任务) 相关关系分析的目的在于研究现象之间相互依存关系的形式及密切程度, 并用一定的数学形式把这种关系反映出来,为统计估算和预测提供重要的依据和 方法 。具体包括: (一)确定经济现象之间是否存在相关关系及相关关系的种类。经济现象间 有无相关关系是能否运用相关关系分析法的前提。确定经济现象之间有无相关关 系的方法有两种:一是作定性判断,它是从经济现象之间的本质联系着手,根据 有关的理论及实践经验进行分析研究来判断的;二是绘制相关图表。 (二)确定经济现象之间相关关系的密切程度 当经济现象之间存在相关关系时,就要测定它们之间关系的密切程度,为进 一步分析研究问题提供依据。 确定现象之间相关关系密切程度的方法是:绘制相关图和计算相关系数。相 关图对相关关系的密切程度可以得出粗略的判断,而相关系数能从数量上对经济 现象之间的相关程度做出明确的反映。 (三)建立经济现象之间数量变动关系的数学方程式(确定相关关系的数学 表达式) 为了测定现象之间数量变化上的一般关系,必须使用函数关系的数学公式作 为相关关系的数学表达式,称为回归方程,用以说明自变量发生变动时,因变量 平均来说会发生多大的变化。 (四)确定因变量估计值误差的程度 根据变量之间变动关系的数学方程式可以计算出各个因变量的估计值,这 些估计值与实际值之间肯定有差异,差异小,表示推算结果的准确度高;差异大, 准确度低。而准确度的高低又关系到回归方程的实用价值。所以相关分析还要测 定因变量估计值和实际值之间差异的大小,用以反映因变量估计值的准确程度。 这种用来反映因变量估计值准确程度的指标叫估计标准误差。 第二节 简单直线相关分析 简单直线相关分析内容 是否存在相关关系 相关关系的种类 相关关系的密切程度
在进行相关分析时,首先对现象之间是否存在依存关系进行定性分析;其次 利用相关图表粗略地反映相关变量之间依存关系的形式、方向;最后计算相关系 数,准确反映相关变量之间关系的密切程度。 、相关表和相关图 (一)相关表 将相关的两个变量的对应数值按照一定的顺序或规格排列在一张表格上所 形成的统计表。 简单相关表 按照资料是否分组相关表分为 分组相关表 1简单相关表:指资料未经分组,只将一个变量的数值按照从小到大(或时 间)顺序、并配合相应的另一个变量的变量值一一对应排列起来形成的表。其步 骤是 第一、将某一变量的变量值按照一定顺序排列 第二、对应地平行列出另一变量的变量值 例1,为了研究分析机床使用年限和年维修费用之间的关系,可从抽取的12 台机床中取得12对数据,见表2-1。 从表中可以直观地看出,尽管在同样的使用年限下,年维修费用也存在着差 异。但总的来看,随着使用年限的增加,年维修费用也在不断地增加,两者之间 呈现出正相关的关系 表2-1 序号机床使用年限(年)年维修费用(元) 22344 540 520 4 640 740 8 10 556668 900 11 840 12 1080
7 在进行相关分析时,首先对现象之间是否存在依存关系进行定性分析;其次, 利用相关图表粗略地反映相关变量之间依存关系的形式、方向;最后计算相关系 数,准确反映相关变量之间关系的密切程度。 一、相关表和相关图 (一)相关表 将相关的两个变量的对应数值按照一定的顺序或规格排列在一张表格上所 形成的统计表。 按照资料是否分组相关表分为 简单相关表 分组相关表 1.简单相关表:指资料未经分组,只将一个变量的数值按照从小到大(或时 间)顺序、并配合相应的另一个变量的变量值一一对应排列起来形成的表。其步 骤是: 第一、将某一变量的变量值按照一定顺序排列 第二、对应地平行列出另一变量的变量值 例 1,为了研究分析机床使用年限和年维修费用之间的关系,可从抽取的 12 台机床中取得 12 对数据,见表 2-1。 从表中可以直观地看出,尽管在同样的使用年限下,年维修费用也存在着差 异。但总的来看,随着使用年限的增加,年维修费用也在不断地增加,两者之间 呈现出正相关的关系。 表 2-1 序 号 机床使用年限(年) 年维修费用(元) 1 2 400 2 2 540 3 3 520 4 4 640 5 4 740 6 5 600 7 5 800 8 6 700 9 6 760 10 6 900 11 8 840 12 9 1080
例2,某地职工工资总额与城镇储蓄存款余额的相关表,见表2-2。 从表中资料可以看出,随着该地职工工资总额的増加,城镇储蓄存款余额也 呈现出增加的趋势,这说明两个变量之间存在着正相关的关系。 表22 年份「职工工资总额(亿元)城镇储蓄存款余额(亿元) 2002 11.5 2003 12.2 2004 41 13.5 2006 20.3 2007 28.3 合 2分组相关表:是根据分组资料绘制的相关表。 当原始资料很多,简单相关表编制和使用起来很不方便时,这时往往对原始 资料进行分组整理,编制成分组相关表。 根据分组的情况不同,分组相关表分为单变量分组表和双变量分组表。 (1)单变量分组表:在具有相关关系的两个变量中,只对一个变量(自变 量)进行分组,并计算出每组的次数,对应的另一个变量(因变量)不分组,只 计算其平均值,这样制成的表为单变量分组相关表,见表2-3 单变量分组相关表可使资料简化,从而更清析地反映出两变量之间的相关关 系。从表2-3中可以看出,机床使用年限和年维修费用之间存在着正相关的关系。 表2-3 使用年限(年)机床数(台)。平均维修费用(元/年) 2345689 690 700 787 840 1080 12 (2)双变量分组相关表:指在具有相关关系的两个变量中,对两个变量同 时进行分组所形成的统计表。即对自变量和因变量都进行分组所编制的分组相关 表。这种表的形状类似棋盘,故又称为棋盘式相关表,其编制步骤为
8 例 2,某地职工工资总额与城镇储蓄存款余额的相关表,见表 2-2 。 从表中资料可以看出,随着该地职工工资总额的增加,城镇储蓄存款余额也 呈现出增加的趋势,这说明两个变量之间存在着正相关的关系。 表 2-2 年 份 职工工资总额(亿元) 城镇储蓄存款余额(亿元) 2002 40 11.5 2003 40 12.2 2004 41 13.5 2005 43 15.5 2006 47 20.3 2007 52 28.3 合 计 — — 2.分组相关表:是根据分组资料绘制的相关表。 当原始资料很多,简单相关表编制和使用起来很不方便时,这时往往对原始 资料进行分组整理,编制成分组相关表。 根据分组的情况不同,分组相关表分为单变量分组表和双变量分组表。 (1)单变量分组表:在具有相关关系的两个变量中,只对一个变量(自变 量)进行分组,并计算出每组的次数,对应的另一个变量(因变量)不分组,只 计算其平均值,这样制成的表为单变量分组相关表,见表 2-3 。 单变量分组相关表可使资料简化,从而更清析地反映出两变量之间的相关关 系。从表 2-3 中可以看出,机床使用年限和年维修费用之间存在着正相关的关系。 表 2-3 使用年限(年) 机床数(台) 平均维修费用(元/年) 2 2 470 3 1 520 4 2 690 5 2 700 6 3 787 8 1 840 9 1 1080 合 计 12 —— (2)双变量分组相关表:指在具有相关关系的两个变量中,对两个变量同 时进行分组所形成的统计表。即对自变量和因变量都进行分组所编制的分组相关 表。这种表的形状类似棋盘,故又称为棋盘式相关表,其编制步骤为:
①分别确定两个变量分组的组数 ②设计棋盘式表格 ③计算各组的次数并放到相对应的方格之中。 对于上例,若将机床使用年限分为7组,年维修费用也分为7组,可设计一 个7×7的棋盘式方程表,将次数置入方格之中,便形成了双变量分组相关表 一般情况下,自变量的数值放在宾词栏(上端),且数值从左到右按由小到 大的顺序排列;因变量放在表的主词栏(左端),且数值自上而下由大到小的顺 序排列;最后计算各组相对应的次数,并设计两个合计栏,分别表明各个变量分 组的次数分布情况。见表24 由表24可以看出,两个变量之间呈正相关的关系,即机床使用年限越长 年平均维修费用越多。 表2-4 年维修费用 机床使用年限(年) 合计 2345689 1000-1100 900-1000 800-900 700-800 2322 500-600 400-500 合计 2122311 12 (二)相关图 相关图又叫散点图,它是在平面坐标系中(以横轴表示自变量ⅹ,纵轴表示 因变量y),将相关表中两个变量对应值用相关点(散点、坐标点)形式描绘出 来,通过观察相关点的分布情况,大致看出两个变量之间有无相关关系及相关的 类型、密切程度。现将表2-1资料绘制成相关图如图2-1。 从图中可以看出,机床使用年限和年维修费用之间存在着比较密切的 相关关系,而且两者之间的变动趋势基本呈现直线型的
9 ①分别确定两个变量分组的组数 ②设计棋盘式表格 ③计算各组的次数并放到相对应的方格之中。 对于上例,若将机床使用年限分为 7 组,年维修费用也分为 7 组,可设计一 个 7×7 的棋盘式方程表,将次数置入方格之中,便形成了双变量分组相关表。 一般情况下,自变量的数值放在宾词栏(上端),且数值从左到右按由小到 大的顺序排列;因变量放在表的主词栏(左端),且数值自上而下由大到小的顺 序排列;最后计算各组相对应的次数,并设计两个合计栏,分别表明各个变量分 组的次数分布情况。见表 2-4。 由表 2-4 可以看出,两个变量之间呈正相关的关系,即机床使用年限越长, 年平均维修费用越多。 表 2-4 年维修费用 (元) 机床使用年限(年) 合计 2 3 4 5 6 8 9 1000-1100 1 1 900-1000 1 1 800-900 1 1 2 700-800 1 2 3 600-700 1 1 2 500-600 1 1 2 400-500 1 1 合 计 2 1 2 2 3 1 1 12 (二)相关图 相关图又叫散点图,它是在平面坐标系中(以横轴表示自变量 x,纵轴表示 因变量 y),将相关表中两个变量对应值用相关点(散点、坐标点)形式描绘出 来,通过观察相关点的分布情况,大致看出两个变量之间有无相关关系及相关的 类型、密切程度。现将表 2-1 资料绘制成相关图如图 2-1。 从图中可以看出,机床使用年限和年维修费用之间存在着比较密切的 相关关系,而且两者之间的变动趋势基本呈现直线型的
1200 1000 800 年维修费600 200 0246810 使用年限 图2-1 相关系数 (一)相关系数的概念 根据相关图和相关表可以初步判断经济现象之间有无相关关系,以及相关的 趋势和形态。但是,这种直观的判断是粗略的,为了准确反映现象之间相关关系 的密切程度,需要计算相关系数。在各种相关关系中,单相关是最基本的相关关 系,它是复相关的基础,单相关有线性相关和非线性相关两种。而简单线性相关 系数是最基本的,它是计算其它相关系数的基础。这里所说的相关系数指简单线 性相关系数 相关系数:是说明两种现象之间直线相关关系密切程度的统计分析指标。 或:在线性相关条件下,用来说明两个变量之间相关关系密切程度的统计分 析指标 (二)相关系数的一般公式及其剖析 计算相关系数的方法很多,以英国统计学家皮尔逊( Karl Pearson)的积差 法用得最为普遍,其它的如等级相关系数、点双列相关系数、Φ相关系数、偏相 关系数等都是在这个相关系数的基础上推导出来的,用以不同的场合,说明不同 的问题(后面分别介绍)。 积差法相关系数:是通过两个变量与各自平均数的离差的乘积来反映两个 变量之间相关关系的密切程度的。 其基本公式如下: 10
10 0 200 400 600 800 1000 1200 0 2 4 6 8 10 年维修费 使用年限 图 2-1 二、相关系数 (一)相关系数的概念 根据相关图和相关表可以初步判断经济现象之间有无相关关系,以及相关的 趋势和形态。但是,这种直观的判断是粗略的,为了准确反映现象之间相关关系 的密切程度,需要计算相关系数。在各种相关关系中,单相关是最基本的相关关 系,它是复相关的基础,单相关有线性相关和非线性相关两种。而简单线性相关 系数是最基本的,它是计算其它相关系数的基础。这里所说的相关系数指简单线 性相关系数。 相关系数:是说明两种现象之间直线相关关系密切程度的统计分析指标。 或:在线性相关条件下,用来说明两个变量之间相关关系密切程度的统计分 析指标。 (二)相关系数的一般公式及其剖析 计算相关系数的方法很多,以英国统计学家皮尔逊(Karl Pearson)的积差 法用得最为普遍,其它的如等级相关系数、点双列相关系数、 相关系数、偏相 关系数等都是在这个相关系数的基础上推导出来的,用以不同的场合,说明不同 的问题(后面分别介绍)。 积差法相关系数:是通过两个变量与各自平均数的离差的乘积来反映两个 变量之间相关关系的密切程度的。 其基本公式如下: