因子分析 公共卫生学院
因子分析 公共卫生学院
前言 变量的相关性 公共因子? 将多个实测变量转换成少数几 个不相关的综合指数
一、前言 • 变量的相关性 公共因子? • 将多个实测变量转换成少数几 个不相关的综合指数
二、因子分析模型 般地,设X=(x,x2…,x)为可观测 的随机变量,且有 X1=4+anf+a2·2+…+lmfn+e1 ·f=(f,f2,,fn)为公共(共性)因子 ( common factor),简称因子( factor)
二、因子分析模型 一般地,设X=(x1 , x2 , …,xp )’为可观测 的随机变量,且有 • f=(f1 ,f2 ,…,fm)’为公共(共性)因子 (common factor),简称因子(factor) i i i i i m m i X = + a f + a f + + a f + e 1 1 2 2
e=(e1e2y…,ep)为特殊因子( specific factor f和e均为不可直接观测的随机变量 μ=(H12,…,4)为随机变量x的总体 均值 A=(a1)m为因子负荷(载荷) ( factor loading)矩阵
• e=(e1 ,e2 ,…,ep )’为特殊因子(specific factor) f和e均为不可直接观测的随机变量 • μ=(μ1 ,μ2 ,…,μp )’为随机变量x的总体 均值 • A=(aij)p*m为因子负荷(载荷) (factor loading)矩阵
通常先对x作标准化处理,使标准化得到的新 变量均值为零,方差为1.这样就有 +a122 ·…+a2 假定(1)f的均数为0,方差为1; (2)e的均数为0,方差为8; (3)f与e相互独立 则称x为具有m个公共因子的因子模型
通常先对x作标准化处理,使标准化得到的新 变量均值为零,方差为1.这样就有 假定(1)f i的均数为0,方差为1; (2)ei的均数为0,方差为δi; (3) f i与ei相互独立. 则称x为具有m个公共因子的因子模型 i i i i m m i x = a f + a f + + a f + e 1 1 2 2
如果再满足(4)f与千相互独立 (i),则称该因子模型为正交因子 模型。 正交因子模型具有如下特性: ·x的方差可表示为 Var(xi)=l=ai+an+.+aim+& 设h12=a2+a2+…+a2
如果再满足(4)fi与fj相互独立 (i≠j),则称该因子模型为正交因子 模型。 正交因子模型具有如下特性: • x的方差可表示为 设 i i i i m i Var x = = a + a + + a + 2 2 2 2 1 ( ) 1 2 2 2 2 1 2 hi ai ai + ai m = + +
(1)h是m个公共因子对第个变量 的贡献,称为第个共同度 ( communality)或共性方差,公因 子方差( common variance) 2)8称为特殊方差( specific variance),是不能由公共因子解释 的部分
(1)hi 2是m个公共因子对第i个变量 的贡献,称为第i个共同度 (communality)或共性方差,公因 子方差(common variance) (2)δi称为特殊方差(specific variance),是不能由公共因子解释 的部分
因子载荷(负荷)a是随机变量x与 公共因子千的相关系数。 设 J 称g2为公共因子f对x的“贡献”,是 衡量公共因子重要性的一个指标
• 因子载荷(负荷)aij是随机变量xi与 公共因子fj的相关系数。 • 设 称gj 2为公共因子fj对x的“贡献”,是 衡量公共因子fj重要性的一个指标。 2 2 1 1, 2,..., p j ij i g a j m = = =
三、因子分析的步骤 ·输入原始数据xn计算样本均值和方 差,进行标准化计算(处理); 求样本相关系数矩阵R=(r)pp 求相关系数矩阵的特征根 (12-2, ●●· p>0)和相应的标准正交的特征 向量l1;
三、因子分析的步骤 • 输入原始数据xn*p,计算样本均值和方 差,进行标准化计算(处理); • 求样本相关系数矩阵R=(rij)p*p; • 求相关系数矩阵的特征根λi (λ1 ,λ2 ,…,λp>0)和相应的标准正交的特征 向量l i;
确定公共因子数; 计算公共因子的共性方差h2 对载荷矩阵进行旋转,以求能更好地 解释公共因子 对公共因子作出专业性的解释
• 确定公共因子数; • 计算公共因子的共性方差hi 2 ; • 对载荷矩阵进行旋转,以求能更好地 解释公共因子; • 对公共因子作出专业性的解释