第9章相关与回归 9.1简单线性相关分析 9.2一元线性回归分析 9.3多元线性回归与复相关分析 94变量间非线性关系的回归
第9章 相关与回归 9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
91简单线性相关分析 、变量之间的关系 确定性关系、非确定性关系 1确定性关系(函数关系):变量之间依一定的函数形 成的一一对应关系,若两个变量分别记做Y与X,则当Y 与X之间存在函数关系时,X值一旦被指定,Y值就是唯 确定的
9.1 简单线性相关分析 一、变量之间的关系 确定性关系、非确定性关系 ▪ 1.确定性关系(函数关系):变量之间依一定的函数形 成的一一对应关系,若两个变量分别记做Y与X,则当Y 与X之间存在函数关系时,X值一旦被指定,Y值就是唯 一确定的
2非确定性关系(相关关系):两个变量之间存在 某种关系,但变量Y并不是由变量X唯一确定的,它 们之间没有严格的一一对应关系。 两个变量之间若存在线性关系称为线性相关,存在 非线性关系称为曲线相关,通常通过适当的变量变 换,曲线相关可转换为线性相关
▪ 2.非确定性关系(相关关系):两个变量之间存在 某种关系,但变量Y并不是由变量X唯一确定的,它 们之间没有严格的一一对应关系。 ▪ 两个变量之间若存在线性关系称为线性相关,存在 非线性关系称为曲线相关,通常通过适当的变量变 换,曲线相关可转换为线性相关
3、相关的种类 (1)按相关的程度分为完全相关、不完全相关 和不相关。 两种依存关系的标志,其中一个标志的数量变 化由另一个标志的数量变化所确定,则称完全 相关,也称函数关系。 两个标志彼此互不影响,其数量变化各自独立, 称为不相关。 两个现象之间的关系,介乎完全相关与不相关 之间称不完全相关
3、相关的种类 (1)按相关的程度分为完全相关、不完全相关 和不相关。 ▪ 两种依存关系的标志,其中一个标志的数量变 化由另一个标志的数量变化所确定,则称完全 相关,也称函数关系。 ▪ 两个标志彼此互不影响,其数量变化各自独立, 称为不相关。 ▪ 两个现象之间的关系,介乎完全相关与不相关 之间称不完全相关
(2)按相关的方向分为正相关和负相关 正相关指相关关系表现为因素标志和结果标志的数 量变动方向一致。 负相关指相关关系表现为因素标志和结果标志的数 量变动方向是相反的。 (3)按相关的形式分为线性相关和非线性相关 种现象的一个数值和另一现象相应的数值在指教 坐标系中确定为一个点,称为线性相关。 (4)按影响因素的多少分为单相关和复相关。 如果研究的是一个结果标志同某一因素标志相关, 就称单相关。 如果分析若干因素标志对结果标志的影响,称为复 相关或多元相关
(2)按相关的方向分为正相关和负相关 ▪ 正相关指相关关系表现为因素标志和结果标志的数 量变动方向一致。 ▪ 负相关指相关关系表现为因素标志和结果标志的数 量变动方向是相反的。 (3)按相关的形式分为线性相关和非线性相关 ▪ 一种现象的一个数值和另一现象相应的数值在指教 坐标系中确定为一个点,称为线性相关。 (4)按影响因素的多少分为单相关和复相关。 ▪ 如果研究的是一个结果标志同某一因素标志相关, 就称单相关。 ▪ 如果分析若干因素标志对结果标志的影响,称为复 相关或多元相关
、总体相关系数 在统计上衡量两个随机变量X、Y取值间相互 联系的程度和方向的量是协方差Cov(X,Y) 和相关系数,有 Cov(x,Y)=Ox=ERLX-E(XIY-E(Y] pxy XY YY
二、总体相关系数 XY ( ) ( ) XY XY XX YY E X E X Y E Y = − − = Cov(X,Y)= 在统计上衡量两个随机变量X、Y取值间相互 联系的程度和方向的量是协方差Cov(X,Y) 和相关系数,有
证明/x≤1 证:对于任意实数λ,有 DOr-AX=ElY-nX-E(r-nX) E[Y-E(Y)]-[X-E(X)] ELY -E(I+AFEIX-E(X) 2E(LY-E(YDJIX-E(X yy+Aoxx-2no 令=x,则有D(-0X)=ay+(00)o-26x O XX XX YY 由方差的性质知,an(1-p2)≥0,所以≤1
证明 XY 1 2 D Y X E Y X E Y X ( ) [ ( )] − = − − − 证:对于任意实数 ,有 2 = − − − E Y E Y X E X [ ( )] [ ( )] 2 2 2 [ ( )] [ ( )] 2 [ ( )][ ( )] E Y E Y E X E X E Y E Y X E X = − + − − − − 2 2 = + − YY XX XY XY XX 令 = ,则有 ( ) 2 XY XY XY YY XX XY XX XX XX D Y X − = + − ( )2 2 XY 2 YY YY XX = − = (1- ) 2 1 由方差的性质知, YY(1- ) 0,所以
、样本相关系数 变量Y和X之间线性相关的程度可以用样本相关系数r度量。 无法显示该图片 公式为=Sy XXYY ∑(X1-X-为样本协方差 ∑(X1-x ∑(-y) n-1
三、样本相关系数 2 2 1 1 ( ) ( ) 1 1 n n i i i i XX YY X X Y Y S S n n = = − − − − = ; = 变量Y X 和 之间线性相关的程度可以用样本相关系数r度量。 r XY XX YY S S S 公式为 = 1 1 ( ) 1 n XY i i i S X X Y Y n = − − − = ( )为样本协方差
样本相关系数r的另一个计算公式为: ∑x-∑∑ r 2∑x-②x) y i=1 相关系数r的取值为:-1≤r≤1
样本相关系数r的另一个计算公式为: 1 1 1 2 2 2 2 1 1 1 1 r ( ) ( ) n n n i i i i i i i n n n n i i i i i i i i n x y x y n x x n y y = = = = = = = − = − − 相关系数r 1 r 1 的取值为:−
r=+1,变量Y和X是完全正相关; r=-1,变量Y和X是完全负相关; x无法显示该图片 在这两种情况下,Y和X之间的关系是函数关系。 r=0时,只能说明Y和X之间不存在线性统计关系, 但可能存在非线性关系 y y ° [正相关X[负相关X[曲线相关X[不相关
r 1 r 1 r 0 Y X Y X Y X Y X + − = ,变量 和 是完全正相关; = ,变量 和 是完全负相关; 在这两种情况下, 和 之间的关系是函数关系。 = 时,只能说明 和 之间不存在线性统计关系, 但可能存在非线性关系 x y 正 相 关 x y 负 相 关 x y 曲线相关 x y 不 相 关