第、章虚拟变量模型 PDF文件使用"pdfFactory Pro”试用版本创建w,fineprint.cn
第八章 虚拟变量模型 PDF 文件使用 "pdfFactory Pro" 试用版本创建 @www.fineprint.cn
目录 Q一、虚拟变量的基本含义 Q二、虚拟变量的设置原则 ·三、虚拟变量的引入 ·四、虚拟变量的特殊应用 ·五、虚拟变量引入模型的作用 PDF文件使用"pdfFactory Pro”试用版本创建wm,fineprint.cn
一、虚拟变量的基本含义 二、虚拟变量的设置原则 三、虚拟变量的引入 四、虚拟变量的特殊应用 五、虚拟变量引入模型的作用 目录 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.cn
一、 虚拟变量的基本含义 Q许多经济变量是可以定量度量的,如:商品需求 量、价格、收入、产量等 Q但也有一些影响经济变量的因素无法定量度量, 如:职业、性别对收入的影响,战争、自然灾害 对GDP的影响,季节对某些产品(如冷饮)销售 的影响等等。 Q为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化”, PDF文件使用"pdfFactory Pro”试用版本创建w,fineprint.cn
许多经济变量是可以定量度量的,如:商品需求 量、价格、收入、产量等 但也有一些影响经济变量的因素无法定量度量, 如:职业、性别对收入的影响,战争、自然灾害 对GDP的影响,季节对某些产品(如冷饮)销售 的影响等等。 为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化” , 一、虚拟变量的基本含义 PDF 文件使用 "pdfFactory Pro" 试用版本创建 ÿwww.fineprint.cn
一、 虚拟变量的基本含义 这种“量化”通常是通过引入“虚拟变量”来完成 的。根据这些因素的属性类型,构造只取“0”或“1”的人 工变量,通常称为虚拟变量(dummy variables),记为D。 ·例如,反映文程度的虚拟变量可取为: 1, 本科学历 D= 0, 非本科学历 一般地,在虚拟变量的设置中: ·基础类型、肯定类型取值为1; ·比较类型,否定类型取值为0。 PDF文件使用"pdfFactory Pro”试用版本创建mm,fineprint.cn
这种“量化”通常是通过引入“虚拟变量”来完成 的。根据这些因素的属性类型,构造只取“0”或“1”的人 工变量,通常称为虚拟变量(dummy variables),记为D。 例如,反映文程度的虚拟变量可取为: 1, 本科学历 D= 0, 非本科学历 一般地,在虚拟变量的设置中: • 基础类型、肯定类型取值为1; • 比较类型,否定类型取值为0。 一、虚拟变量的基本含义 PDF 文件使用 "pdfFactory Pro" 试用版本创建 ÿwww.fineprint.cn
虚拟变量的基本含义 同时含有一般解释变量与虚拟变量的模型称为虚拟 变量模型或者方差分析(analysis-of variance: ANOVA)模型。 一个以性别为虚拟变量考察企业职工薪金的模 型: Y=Bo+B X;+B2D+u 其中:Y为企业职工的薪金,X为工龄, D,=1,若是男性,D=O,若是女性。 PDF文件使用"pdfFactory Pro”试用版本创建ww,fineprint.cn
同时含有一般解释变量与虚拟变量的模型称为虚拟 变量模型或者方差分析(analysis-of variance: ANOVA)模型。 一个以性别为虚拟变量考察企业职工薪金的模 型: Yi = b0 + b1Xi + b2Di + mi 其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。 一、虚拟变量的基本含义 PDF 文件使用 "pdfFactory Pro" 试用版本创建 ÿwww.fineprint.cn
二、虚拟变量的设置原则 虚拟变量的个数须按以下原则确定: 每一定性变量所需的虚拟变量个数要比该定 性变量的类别数少1,即如果有m个定性变量,只在 模型中引入m-1个虚拟变量。 例。已知冷饮的销售量Y除受k种定量变量X的 影响外,还受春、夏、秋、冬四季变化的影响,要考 察该四季的影响,只需引入三个虚拟变量即可: 1 春季 1 夏季 秋季 D 0 其他 D:=0其他 其他 PDF文件使用"pdfFactory Pro”试用版本创建wm,fineprint.cn
虚拟变量的个数须按以下原则确定: 每一定性变量所需的虚拟变量个数要比该定 性变量的类别数少1,即如果有m个定性变量,只在 模型中引入m-1个虚拟变量。 例。已知冷饮的销售量Y除受k种定量变量Xk的 影响外,还受春、夏、秋、冬四季变化的影响,要考 察该四季的影响,只需引入三个虚拟变量即可: î í ì = 0 1 D1t 其他 春季 î í ì = 0 1 D2t 其他 夏季 î í ì = 0 1 D3t 其他 秋季 二、虚拟变量的设置原则 PDF 文件使用 "pdfFactory Pro" 试用版本创建 ÿwww.fineprint.cn
二、虚拟变量的设置原则 则冷饮销售量的模型为: Y,Bo B Xy+A BxXk +a Du+a2D2 +a3Ds +u 在上述模型中,若再引入第四个虚拟变量 冬季 D4= 1 0 其他 测冷饮销售模型变量为: Y Bo+B X+BXk +a Du +a2D2+a3D3+Dar+u 其矩阵形式为: B Y=(X,D) PDF文件使用"pdfFactory Pro”试用版本创建ww,fineprint.cn
则冷饮销售量的模型为: 在上述模型中,若再引入第四个虚拟变量 Yt = b0 + b1X1t +L bk Xkt +a1D1t +a2D2t +a3D3t + mt î í ì = 0 1 D4t 其他 冬季 则冷饮销售模型变量为: Yt = b0 + b1X1t +L bk X kt +a1D1t +a2D2t +a3D3t +a4D4t + mt 其矩阵形式为: μ α β Y (X,D) +÷ ÷ ø ö ç ç è æ = 二、虚拟变量的设置原则 PDF 文件使用 "pdfFactory Pro" 试用版本创建 ÿwww.fineprint.cn
二、虚拟变量的设置原则 如果只取六个观测值,其中春季与夏季取了两 次,秋、冬各取到一次观测值,则式中的: 1XAX1100 0 0 Bo 01 1X2AXk2010 1X13△Xk30010 B= B 02 (X,D)= 0= 1X4AXk40001 M 3 1X15ΛXk50100 1X6AX61000 B 显然,(X,D)中的第1列可表示成后4列的线性组合, 从而(X,D)不满秩,参数无法唯一求出。 这就是所谓的“虚拟变量陷井”,应避免。 若无截距项,则引入m个虚拟变量 PDF文件使用"pdfFactory Pro”试用版本创建mm,fineprint.cn
如果只取六个观测值,其中春季与夏季取了两 次,秋、冬各取到一次观测值,则式中的: 显然,(X,D)中的第1列可表示成后4列的线性组合, 从而(X,D)不满秩,参数无法唯一求出。 这就是所谓的“虚拟变量陷井”,应避免。 ÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷ ø ö ç ç ç ç ç ç ç ç è æ = 1 1 0 0 0 1 0 1 0 0 1 0 0 0 1 1 0 0 1 0 1 0 1 0 0 1 1 0 0 0 ( ) 16 6 15 5 14 4 13 3 12 2 11 1 k k k k k k X X X X X X X X X X X X L L L L L L X,D ÷ ÷ ÷ ÷ ÷ ø ö ç ç ç ç ç è æ = bk b b M 1 0 β ÷ ÷ ÷ ÷ ÷ ø ö ç ç ç ç ç è æ = 4 3 2 1 a a a a α 若无截距项,则引入m个虚拟变量 二、虚拟变量的设置原则 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.cn
三、虚拟变量的引入 虚拟变量做为解释变量引入模型有两种基本方 式:加法方式和乘法方式。 1、加法方式 上述企业职工薪金模型中性别虚拟变量的引 入采取了加法方式。 在该模型中,如果仍假定E(山)=0,则 企业女职工的平均薪金为: E(Y,IX,D=0)=B。+B1X, 企业男职工的平均薪金为: E(Y,|X,D,=1)=(B。+B2)+BX PDF文件使用"pdfFactory Pro”试用版本创建iww,fineprint.cn
虚拟变量做为解释变量引入模型有两种基本方 式:加法方式和乘法方式。 E Yi X i Di 0 1 X i ( | , = 0) = b + b 企业男职工的平均薪金为: E Yi Xi Di 0 2 1Xi ( | , = 1) = (b + b ) + b 上述企业职工薪金模型中性别虚拟变量的引 入采取了加法方式。 在该模型中,如果仍假定E(mi)=0,则 企业女职工的平均薪金为: 1、加法方式 三、虚拟变量的引入 PDF 文件使用 "pdfFactory Pro" 试用版本创建 Ìwww.fineprint.cn
三、虚拟变量的引入 几何意义: ·假定阝,>0,则两个函数有相同的斜率,但有不同的截 距。意即,男女职工平均薪金对工龄的变化率是一样 的,但两者的平均薪金水平相差β2 ·可以通过传统的回归检验,对B,的统计显著性进行检 验,以判断企业男女职工的平均薪金水平是否有显著 差异。 年薪Y 男职工 女职工 B21 Bo 工龄X PDF文件使用"pdfFactory Pro”试用版本创建wm,fineprint.cL
假定b2 >0,则两个函数有相同的斜率,但有不同的截 距。意即,男女职工平均薪金对工龄的变化率是一样 的,但两者的平均薪金水平相差b2。 可以通过传统的回归检验,对b2的统计显著性进行检 验,以判断企业男女职工的平均薪金水平是否有显著 差异。 年薪Y 男职工 女职工 工龄X b0 b2 三、虚拟变量的引入 几何意义: PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.cn