杜会学系列教村 第一章 家的 导论 本书是一本集多元社会科学研究统计方法及相应SPSS统计软件应用的教 材 科学的性质要求一个完整的研究必须理论联系实际,能够比较准确地刻画事 物的现状、把握它的内在规律、并力图能够预测它的发展趋势。长期以来,社会 科学研究由于其研究对象的复杂性以及量化分析水平很低,总是较多地依赖于概 念定义和逻辑推理,处于单纯思辨的范围中,很少具有经验(实证)研究的性 质。因此,总是有很多人并不将其作为科学来对待 社会科学研究的这种特征是由于三方面影响所致。首先,从测量角度而言, 社会科学的概念十分抽象,难以量化,而实际观测和数据收集所涉及范围很大 因此实际观测数据不易得到。第二,由于社会科学的变量几乎都是随机变量,描 述它们之间的关系很难用一般数学方法,而必须应用概率统计方法。第三,由于 数据规模较大和必须应用概率统计方法,导致研究分析时涉及大量复杂的计算工 作。应该说,这些方面相互影响制约,使得理论联系实际本身有较大难度。 本书集中介绍了12种社会科学研究的统计方法,包括:回归分析、因子分 析、聚类分析、通径分析、 logistic回归、对数线性模型、多元方差分析、鉴别 分析、典型相关分析、结构方程模型、事件史分析、对应分析
这些方法在近年来国际社会科学研究文献中经常使用,已经达到十分普及的 程度。换句话说,这些方法已经相对成熟,并且已经配有计算机软件,所以能够 得到迅速普及。本书作者希望能够帮助读者了解这些方法的用途、原理、条件 操作和统计结果的理解和应用,使读者不仅能够更好地理解关于这些方法的有关 文献资料,而且能够自己运用这些方法来开展研究。 本书所介绍的这些统计方法并不十分神秘。只要具有一定统计基础的读者, 不难通过本书的介绍了解它们的用途和基本原理。本书并没有太多的深奥繁琐的 数学证明,一些公式推导的目的也并不在于证明这些方法,而主要服务于揭示统 计指标之间的内在联系。即使读者在学习时忽略这些公式推导,并不影响其对于 整个方法的理解和应用。特别是由于本书中介绍的所有方法都伴以SPSS软件的 操作应用,读者能够很容易复制例题的统计结果,按照例题背景情况理解它们的实 际意义,并进一步发挥自己的主观能动性将这些方法应用于自己的研究中去。 是发展较早、应用非常普遍的社会统计软件包。它具有十分强大的数 据处理、统计分析功能,同时又具有易学、易用的特点。因此,本书所介绍的高 级统计方法将以 SPSS for Windows第6版作为应用软件。 关于本书各章的简介 本书所介绍的12种社会统计方法,基本上每种方法成为独立的一章。每 章可以单独学习,但是它们之间也存在着一定的内在联系。比如,第五章通径分 析实际上是第二章回归分析的扩展,而它同时又是第十一章结构方程模型的一种 待例情况。对于应用来说,更重要的问题是,各种方法都是在一定具体条件下应 用的,因此如何选择适当的方法便成为正确应用这些方法的前提。 本节简介这些方法应用的具体条件,使读者在阅读各种方法介绍的内容之 ,先形成对这些方法的分类框架概念。 为了建立这些方法的分类框架,需要具备一些统计学基础知识,即变量测度 等级的概念。下面第一小节是对变量测度等级的简介。然后,在第二小节中对各 种方法做一概括。第三小节将按照各种方法应用的变量条件列出一个框架图 1.变量的测度等级 在科学研究中,用变量来量化描述概念含。但是不同概念能够被量化的程度有 所不同,另外即使一个概念实际上具备较高的量化程度,而在实际观测时也可能 因为具体情况而采用较低的量化程度。这种量化程度在统计学中称为变量的测度
等级或测度水平( measurement level)①。 变量的测度等级直接关系到统计分析方法的选择。 变量的测度等级的划分有多种,一般常用的划分为四种,即:名义测度、序 次测度、间距测度、比率测度。 名义测度( norminal measurement)是最低的一种测度等级,也称定名测度。 实际上,名义测度变量的值只代表类型的编码,而这些编码的数值只是一个符 号,数值之间不存在有实际意义的量的关系。比如,性别便是一个名义测度等级 的变量,可以将男性编码定为1,女性编码定为2,但是如果反过来定义编码. 或换用其他任意两个不同的数,甚至直接以文字代表类别,变量所包含的信息也 没有任何损失 序次测度( ordinal measurement)的量化水平高于名义测度,也就是说它所 包含的信息量大于名义测度等级的变量。因为在序次测度等级的变量中,变量编 码不仅具有分类的作用,而且也存在量的关系。比如,受教育程度这个序次测度 等级的变量,采用数字编码表示不同类别,比如:文盲半文盲=1,小学=2,初 中=3,高中=4,大学=5。从中可以看出,随着受教育程度的提高,编码值越 来越大。虽然可以换用2至6甚至反序6至2作为其编码不会损失信息,但是不 可以随意调换各类在序列中的位置。因为,各编码的序值代表了受教育程度的高 低差异。尽管不能准确描述这一差异的大小,但是可以确定这一差异的方向。换 句话说,这些编码值可以应用于不等式计算。比如从受教育程度而言,如果已知 高中>初中,初中>小学,便可以肯定有高中>小学的数量关系。 间距测度等级( interval measurement)的量化程度更高,它的取值不再是类 的编码,而是采用定单位的实际测量值。这时不仅可以知道两个不同变量值存 在差异,而且可以应用减法得到两值之间的差或应用加法得到两值之间的和,它 们的差与和都有实际意义。但是,间距测度等级的变量值之间不能进行乘除计 算,这是因为这一测度等级的变量所取的0值不是物理意义上的绝对0。比如, 在采用摄氏温度时,不能说10度是5度的2倍。因为将这两个摄氏温度换算为 K温度后,这两个温度便不再是2倍关系 比率测度( ratio measurement)是最高级的测度等级,它除了具有间距测度 ①参见Blxk,HM.(1979) Social Statistics, Revised Second Edition. McGraw-hill Inc.:l5-20 郭志刚、郝虹生、杜亚军、曲海波:《社会调查研究的量化方法》,1版,139-145页, 北京,中国人民大学出版社,1989
等级的所有性质外,而且其0值是非人为制定的,比如K温度中的0度被称为 绝对0度。只有变量的0值不是人为制定的中介值,而是绝对0(即没有再比它 更小的取值)时,其任意两个取值的比率才能有确定的意义。 从以上简介可以看出,测度等级关系到对变量信息的理解。测度等级越高 变量所包含的信息越多。对于同一个变量,较高测度等级不但包含较低测度等级 全部信息,而且还附加其他信息。因此,较高测度等级的变量实际上可以降级使 用。统计分析中经常采用降级使用。 比如,将序次测度变量作为名义测度变量使用,这时常常将这两种测度等级 合称为分类变量。 另外,将比率测度变量作为间距测度变量使用。有些教材将其称之为连续变 量,其实这两种测度等级变量并不一定要求取值连续(即变量可以只取整数值)。 所以,对它们吏准确的称谓是测量型变量,因为它们都可以取得精确的变量测量 值。从统计分析的角度,间距测度等级便是最高等级。所以比率测度变量只好作 为间距测度变量来使用。如上所述,对于间距测度变量,可以应用加法和减法计 算,所以计算所有变量观测值的和是有意义的,并进而计算变量的平均值(注意 计算平均值时的分母并不是变量值,而是观测频数)。而且,可以计算各变量值 与平均值之间的差(离差),并进而计算变量的方差和标准差。 但是应当明确,这种降级使用意味着一部分信息没有被利用,造成了一定的 信息浪费、所以,应当尽量避免这种损失,只有在迫不得已的情况下才这样做 在硏究方案制定的时候,应该对于能够应用的统计方法了如指掌,根据实际 情况尽可能在调査时将变量设置为间距测度等级,以获得较多的信息。在分析 时,尽可能将变量作为间距测度等级来使用,以避免信息的浪费。 2.本书所介绍的分析方法的概述 本书各章介绍了12种社会统计方法,可以用最简练的语言将这些分析方法 加以概括如下 多元回归应用于单方程模型,其因变量必须为测量型变量,其自变量可以为 测量型变量或虚拟变量。研究目的是通过自变量的变化来预测因变量的变化。多 元回归用最小二乘法求解回归系数。 如果变量之间有多层因果关系,便可以由多个有内在联系的多元回归方程组 成一套通径分析联立方程组,每个方程都通过多元回归求解系数,然后应用通径 分析分解变量之间的直接作用和间接作用。 如果一套联立方程组中含有潜在变量(即不可直接观测的变量),便不能再用
最小二乘法求解,这时叮以应用结构方程模型,它主要采用最大似然估计求解。 在研究有两组各包含多个变量的变量组之间的关系时,可以采用典型相关分 析。典型相关分析的所有变量必须为测量型变量或虚拟变量。 多元方差分析研究两个以上的类别中在多项测量型数据指标上是否存在显著 差异。 当因变量为二分类变量且自变量为测量型变量和虚拟变量时,不能采用多元 回归,而应该采用 logistic回归。 logit模型是对数线性模型的一种特例。它与 logistic回归的不同在于,它的 自变量全部都是分类变量。 鉴别分析主要应用于在已知一些案例的各种条件值及其结果类型的条件下, 形成鉴别方程,并应用于其他条件值已知但结果类型未知的案例,预测它们的结 果类型。这种方法可以视为因变量为多分类结果,自变量为测量型或虚拟变量的 因果预测。它的主要应用目的是进行鉴别分类。 在使用纵贯数据进行因果分析时,事件史分析是可以应用的分析技术。其 中,离散时间模型实际上就是用 logistic回归求解。而Cx比例风险模型是连续 变量模型,它分为两种,一种包括动态变量(即随时间变化的自变量),另一种 不包括动态变量。事件史分析的数据处理是一项比较复杂的工作,本书第十三章 专门介绍这方面的技术。 至于因子分析、聚类分析和对应分析不是因果模型,它们分别用以分析变 量、案例或类型(变量值)之间的结构关系。将它们称为相依模型。 因子分析经常服务于浓缩多个测量型变量,使之转换为较少数量的新变量 (称为因子)后,仍然携带原变量的绝大部分信息。 聚类分析用于分析各案例在多个测量型变量值上的近似性距离,将其按近似 性原则进行案例排列 对应分析可以用来对不同非测量型变量的类别之间进行分析,以作图形式显 示不同变量类别之间的近似程度。 3.本书介绍的统计方法的分类框架 这些分析方法应该根据实际研究的具体目的、分析模型及其数据资料来选 用、为了便于读者对于这些方法形成较为系统的认识,可以根据研究模型类型、 因变量数目、因变量和自变量的测度等级四个方面对这些方法进行分类,对这些 分析方法之间的特征和差别进行框架性的概括,但这种概括只能是大致的 以下框架(见图1-1)首先按照观测数据的来源分为两大类:第一类是横
菜H ! 武晷 回 製状烂期类士 城R 皿 c 劂 6
贯数据( cross-sectional data)。横贯数据指在同一时间、不同案例的观察数据。 它可以来自于一次普査、抽样调查或分地区(部门)的统计资料汇总表等。本书 所介绍的方法主要是应用于横贯数据的方法。 第二类是纵贯数据( longitudinal data)。纵贯数据指对同样的案例在不同时 间上的多次观测所得到的数据。从方法论而言,对于研究因果关系,纵贯数据具 有更高的有效性。然而,纵贯数据的取得相对于横贯数据要难得多。它可以来自 于追踪观测,然而追踪调查存在周期长、成本高、案例容易损耗等困难。它也可 以来自回顾调查,但是回顾调查往往发生由于记忆不准所造成的偏差。实际上, 本书所介绍的方法中只有事件史分析属于这一类。所以,在框架中直接以该方法 名称作为标注。 该框架的第二种划分是分析模型的属性。一类是因果模型( dependence model),一类是相依模型( interdependence model)Φ。因果模型即在变量中明确 设置因变量和自变量的模型,它们的目的在于描述自变量的变化如何影响因变量 的变化。严格地说,典型相关分析与通常的相关分析的性质一样,都是双向关系等 价的描述,本来属于相依模型。但是由于在实际研究中,研究人员常常心目中对于 典型相关分析的两个变量组有因变量组和自变量组的划分,因此这里为了方便,也 划入了因果关系模型。另外,本书所介绍的对数线性模型,就其本来的性质,是以 数学函数的形式描述多个分类变量的交互频数表。但是在实际应用时,研究者心 目中往往也有因变量和自变量的明确划分,正因为如此,对数线性模型可以被转换 为明确的因果模型,即 logit模型。尽管lgit模型只是对数线性模型的一个特例, 在这个框架中,仍将lgi模型作为对数线性模型的代表列入因果模型类。 该框架所采用的另一种划分便是变量的测度等级。如前所述,在统计分析 中,经常将序次测度变量作为名义变量使用,因此只将这些变量取值作为分类编 码,其表达序次的数量信息便不再使用。这时,我们常常统称这两种测度等级的 混合为分类变量。其变量值只反映分类,没有真正的测量含义。所以,又将其称 之为非测量型数据( nonmetric data)。统计分析中将比率变量降级使用,作为间 距测度变量。由于它们的相同基本性质在于能够测量变量值,所以与非测量型相 对,可以称之为测量型数据( metric data)。 该框架对于因果模型分类时还涉及到模型中因变量的数量,有三种情况: 种是单因变量模型,一种是多因变量模型,一种是多层因果模型。其中单因变量 ①有的统计词典将两者都译为相依模型,实际上抹杀了它们的不同。因此这里不再按 英文原文直译,而是按其实际含义来称谓
模型和多因变量模型都是单一方程模型,而多层因果模型实际上是结构模型,指 由联立方程组构成的模型,即某个变量在有的方程中是因变量,而在其他方程中 是自变量 以上并不是十分严格意义上的类型划分,而是为读者掌握各种方法的典型特 征而建立的框架、其框架图(如图1-1)所示。 、在应用统计的研究中, 要以研究方法论为指导 虽然本书的主要宗旨是介绍社会统计分析方法,但是作为全书导论,在此要 特别强週社会科学研究的整体性,即强调一个好的研究不可能仅仅建立在统计分 析的基础上。统计分析只是整个研究当中的一个环节,因此在学习和应用统计分 析时,必须清醒地把握统计分析的方法论意义,自觉地将其服从于整个研究。 这是因为,科学研究不仅表现为一种有明确目的的探索,而且是通过极为细 致、严谨的特殊方式来进行的。因此,提高方法论素养是减少错误、少走弯路的 必要训练。科学研究工作更要讲究科学的方法论。 研究中所使用的具体方法,包括统计技术方法,不等于方法论,它们在科学 研究中属于不同层次。方法论( Methodology)是硏究过程的理论,从属于认识 论,从一般意义上对于研究进行指导。而方法( Method)则是比较具体的研究 技术或工具。研究方法的正确选择和使用,不仅需要有关研究对象的学科理论指 导、也需要关于研究过程的方法论作为指导。如果对于一般意义的研究方法论掌 握不牢固,那么在使用具体的统计方法开展研究时就很容易发生问题。 1.理论、观察、统计之间的关系 现代社会科学研究中包含三个要素:理论、观察、统计。 科学理论关系到科学的逻辑方面,在基础原理的指导下、根据已经掌握的事 实,经过一系列的思维过程,对未知的社会现象的内在规律形成猜想,或称为科 学假说。恩格斯对于假说演绎方法在科学发展中的作用曾经有过极髙的评价。科 学假说虽然还是对于事物本质联系的猜测性判断,但是它在逻辑结构和符合已知 事实方面已经不存在问题。它与科学理论的不同,只是在于它所依据的原始前提 能否成立,所以它只是对于事物本质联系的一种可能的解释,而实际上经常存在 着多种可能的解释。一种假说是否符合事实,或者各种假说中哪一种相对更好
仍然需要通过实践检验加以确定或选择。在科学发展过程中,假说是理论发展的 重要途径之一。假说是理论形成的初级阶段,随着假说的预见性经受越来越多的 考验,假说转化成理论。但是,假说和理论之间并没有清晰的分界线。科学史证 明,许多为实践多次检验的经典理论仍然带有假说的成分,需要不断地发展、修 正。提岀假说除了需要充分掌握科学原理和已知事实外,还要有严谨的科学推理 能力,而且还需要发挥主观能动性和创造性。日前在社会科学研究领域中,仍然 存在只重理论和知识、疏于科学推理素质训练的倾向,然而这种素质并不是仅仅 通过学习基础理论、专业知识和具体技术方法所能提高的。因此,应该加强方法 论普及,使研究人员对硏究的逻辑、程序有充分的掌握。 现代科学硏究的第二个要素是观察。观察是为研究取得客观实际材料的过 程,它和研究方法直接联系。这里所说的观察是广义的观察,包括应用实验方 法、调査方法、实地研究方法等。这些技术方法应该在方法论理论的指导下得到 正确的应用。首先,研究目的要明确,所进行的研究到底是描述型、解释型、还是 探测型,要十分清楚。其次,还要明确研究总体和分析单位。然后,根据研究的目 的和研究的总体选择观察的方法。此外,选择观察方法还要受到对研究对象控制 水平的限制。在社会科学研究中,当研究单位是家庭、组织、社区时,是很难采用要 求控制水平极高的实验方法的。即使研究单位是个人,由于实验过程会对参加实 验者产生很多副效应,导致实验结论存在较强的内在无效性和外在无效性。因此, 社会科学研究较少釆用实验方法进行观察,更多地依赖调查、实地研究方法。 第三个要素是统计。由于统计方法和计算机技术日新月异的发展,统计在现 代社会科学研究中的地位大大加强了。统计在研究中的作用,除了对于观察数据 汇总进行统计描述外,还可以对于多变量之间的关系进行定量描述。然而,统计在 方法论上日益取得的更重要的意义是,它可以用来把实际观察资料与理论假说的推 论联系起来对假说进行检验。从这个角度来看,统计并不是一个孤立的技术方法.它 还是理论联系实际的一种形式,也可以说是对理论进行实践检验的一种形式。 作为整个研究过程,三个要素是密切联系,相互制约的。将它们统一在-个 完整的研究设计方案中加以实施,是谁进对社会现象认识的最佳途径。如果将研 究看作一个周期性循环上升的过程,这种研究方案的完成本身就构成了一个完整 的周期。然而,在实际中,很多研究并不构成完整的周期。由于对社会现象的知 识太少,尚不叮能形成一定的理论假说,就只能将研究目的放在探测或描述上 还有的时候,由于不具备时间、费用、人力等投入条件,不可能实施一个专门设 计的观察,我们便不得不借助可以得到的其他统计数据。这种数据称为二手资 料,应用二手资料进行的分析称为二手分析( secondary analysi尽管这些数据
中也可能包含我们所需要的信息,但由于当初取得这些数据时仅服务于其他目 的,所以数据的变量设置、测度水平不一定能够完全达到本次研究的要求,而研 究人员又只能在这种条件下开展分析ε这时,研究人员必须明确,数据资料方面 的限制对分析结果构成了哪些可能的损害,是表现在分析结果的有效性上,还是 表现在分析结果的可靠性上。 所以,统计技术的应用决不是孤立的事情,它不仅需要专业理论的指导,也 需要研究方法论的指导。忽视这两个方面,便极易导致研究结论中的谬误。比 如,经常可以见到错误理解和阐述统计结果的问题,即分析计算结果是正确的, 但是对于这些结果的理解和解释却是错误的。 2.统计研究中的常见谬误 在应用统计的研究中,经常可以见到的方法论错误包括:混淆统计联系与因 果关系、事后解释谬误、生态学谬误、还原论谬误、混淆统计检验显著性与实际 显著性等问题。 (1)混淆统计联系与因果关系 在统计研究中,对于统计联系和实际中的因果关系两者是必须加以认真区别 的。因果关系是事物之间的一种本质联系,而统计联系只是观测数据中所反映的 事物的数量联系。比如,相关关系(更严格地说,是偏相关关系)是判断因果关 系存在的一个必要条件,但不是因果关系存在的充分条件。相关关系(或其他形 式的统计关系)的存在,并不能最终证实因果关系的存在。因此,探索事物内在 规律还必须考察其他条件。并且,检查和排除现象之间的虚假相关,也是科学研 究的任务之一。时间先后顺序是判断因果关系的另一个准则,因此观察的时间维 度是研究设计中的另一重要内容。在我国社会科学研究中,普遍以某一时点的横 贯调查数据开展研究,如普查、抽样调查资料的分析等。方法论理论告诉我们, 横贯研究使用的是同一时点的观察资料,它比较适合于对差异的研究,而用于因 果研究时就存在很大的局限性。但是,来自于追踪调查和回顾性调查的纵贯观察 资料能够提供时间变量,于是在分析中可以包含时间顺序的控制,则更有效于因 果联系分析。总之,对于差异和变化的区分,是十分有助于因果关系探索的。由 于在我国社会研究中应用更多的是横贯研究,所以我们更需要在得出或接受研究 结果时考虑其方法论方面的有效性 即使所采用的统计模型是因果模型,并且模型中包括了时间变量,统计分析 所能揭示的仍然只是统计联系,只不过统计模型多加了几个控制条件而已。这种 被实际数据所验证的统计联系,仍然不能等同于因果关系。这是因为,不论多么