正在加载图片...
《实用统计分析方法与SPSS应用》初稿/张文璋 第三节实用统计分析方法概述 一、变量(Variable)的分类 要进行统计分析,离不开统计数据。在搜索数据之前,必须首先了解数据的种类。数据 涉及到变量的取值,通常用变量的取值来描述数据。变量可按多种方法分类,这些分类有助 于选择适当的统计分析方法作进一步的分析与研究。下面按三种方法对变量进行分类:按间 隙分类、按作用分类和按测量尺度分类。 (一)按间隙(aDs)别分 根据一个变量紧挨着的两个观测值之间是否有空隙(缺口),可以把变量分为两类:离 散型变量((variable)和连续型变量((variable)).如果一个变量的覆测值之间有 空隙,该变量称为离散型变量,否则称为连续型变量,如图1-2(A)所示。更准确地说,当 一个变量的任意两个可能取值之间没有其他取值时,该变量是离散的:当一个变量的任意两 个可能取值之间还有其他可能取值时,该变量是连续的。例如,性别(设男性取值为0,女 性取值为)、企业数目、分组情况(设A组取值为1,B组取值为2等)等为离散型变量: 身高、体重、 血压、GDP等为连续型变量 图1-2离散型变量与连续型变量 空隙 没有空隙 (A)离散变量的取值 (B)连续变量的取值 需要指出的是,由于分析的需要,离散型变量经常作为连续型变量处理。而连续型变量 也可以作为离散型变量处理,如可以把“血压”变量分为“低”、“中”、“高”三组变为离散 型变量。 二)按作用划分 根据一个变量在分析时的作用,可以把变量分为因变量(dependent variable)或自变量 (independent variable)。如果一个变量由其他变量来描述,该变量称为因变量或反应变量 (response variable):如果一个变量与其他变量一起用于描述因变量,该变量称为自变量或预 测变量(predictor variable)。例如,在分析家庭收入、性别等因素对消费支出的影响时,收入 变量和性别变量是自变量 ,消费支出变量是因变量 个变量是因变量还是自变量,与统计分析的目的有关。同一个变量在某种分析中作为 因变量,而在其它分析中可能作为自变量。 (三)根据量尺度别分 根据变量测量精度不同,可把变量由低到倒高分为四种尺度:定类变量、定序变量、定距 1、定类变 定类变量又称为名义(nominal)变量。这是一种测量精确度最低、最粗略的基于“质 因素的变量,它的取值只代表观测对象的不同类别,例如“性别”变量、“职业”变量等都 是定类变量。定类变量的取值称为定类数据或名义数据。定类数据的其同特点是用不多的名 称来加以表法,并由梦研究变量每一组出现的次数及其总计数所组成,这种数据是枚举性的 即由计数 一而得。唯一适合于定类数据的数学关系是“等价关系”。因而, 在定类数据叶 同一组内各单位是等价的,同时若更换各不同组的符号并不会改变数据原有的基本信息。因《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 8 第三节 实用统计分析方法概述 一、变量(Variable)的分类 要进行统计分析,离不开统计数据。在搜索数据之前,必须首先了解数据的种类。数据 涉及到变量的取值,通常用变量的取值来描述数据。变量可按多种方法分类,这些分类有助 于选择适当的统计分析方法作进一步的分析与研究。下面按三种方法对变量进行分类:按间 隙分类、按作用分类和按测量尺度分类。 (一)按间隙(gaps)划分 根据一个变量紧挨着的两个观测值之间是否有空隙(缺口),可以把变量分为两类:离 散型变量(discrete variable)和连续型变量(continuous variable)。如果一个变量的观测值之间有 空隙,该变量称为离散型变量,否则称为连续型变量,如图 1-2 (A)所示。更准确地说,当 一个变量的任意两个可能取值之间没有其他取值时,该变量是离散的;当一个变量的任意两 个可能取值之间还有其他可能取值时,该变量是连续的。例如,性别(设男性取值为 0,女 性取值为 1)、企业数目、分组情况(设 A 组取值为 1,B 组取值为 2 等)等为离散型变量; 身高、体重、血压、GDP 等为连续型变量。 图 1-2 离散型变量与连续型变量 需要指出的是,由于分析的需要,离散型变量经常作为连续型变量处理。而连续型变量 也可以作为离散型变量处理,如可以把“血压”变量分为“低”、“中”、“高”三组变为离散 型变量。 (二)按作用划分 根据一个变量在分析时的作用,可以把变量分为因变量(dependent variable)或自变量 (independent variable)。如果一个变量由其他变量来描述,该变量称为因变量或反应变量 (response variable);如果一个变量与其他变量一起用于描述因变量,该变量称为自变量或预 测变量(predictor variable)。例如,在分析家庭收入、性别等因素对消费支出的影响时,收入 变量和性别变量是自变量,消费支出变量是因变量。 一个变量是因变量还是自变量,与统计分析的目的有关。同一个变量在某种分析中作为 因变量,而在其它分析中可能作为自变量。 (三)根据测量尺度划分 根据变量测量精度不同,可把变量由低到高分为四种尺度:定类变量、定序变量、定距 变量和定比变量。 1、定类变量 定类变量又称为名义(nominal)变量。这是一种测量精确度最低、最粗略的基于“质” 因素的变量,它的取值只代表观测对象的不同类别,例如“性别”变量、“职业”变量等都 是定类变量。定类变量的取值称为定类数据或名义数据。定类数据的其同特点是用不多的名 称来加以表达,并由被研究变量每一组出现的次数及其总计数所组成,这种数据是枚举性的, 即由计数一一而得。唯一适合于定类数据的数学关系是“等价关系”。因而,在定类数据中, 同一组内各单位是等价的,同时若更换各不同组的符号并不会改变数据原有的基本信息。因 空隙 没有空隙 (A)离散变量的取值 (B)连续变量的取值
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有