《实用统计分析方法与SPSS应用》初稿/张文球 此,最常用来综合定类数据的统计量是频数、比率或百分比等。 2、定序变量 变凳汉玫为省华odi变圆变。文的收的大小超表元视黎 某种顺序关系(等级、方位 大小等,也是基于“质”因素的变量。例如 变量的取值是:1一小学及以下、2一初中、3一高中、中专、技校、4 -大学专料、5一大学 本科、6一研究生以上。由小到大的取值能够代表学历由低到高。定序变量的取值称为定序 数据或有序数据。适合于定序数据的数学关系是“大于())”和“小于(《)”关系。在定序 据中,同一组内各单位是等价的,相邻组之间的单位是不等价的,它们存在“大于”或不 于”的关系。而且,并进行保序变换(或称单 周变换) 则不 级顺序。最适合用于综合定序数据取值的集中趋势的统计量是中位数。 3、定距变量 定距变量又称为间隔(interval))变量,它的取值之间可以比较大小,可以用加减法计算 出弟异的大小。例如,“年龄”变量,其取值60与20相比,表示60岁比20岁大,并日可 以计算出大40岁(60-20). 定距变量的取值称为定距数据或间隔数据。 定距数据是一些 实的数值,具有公共的、不变的测定单位,可以进行加减乘除运算。定距数据的基本特点是 两个相同间隔的数值的差异相等,例如,年龄的60岁与50岁之差等于40岁与30岁之差。 对于定距数据,不仅可以规定“等价关系”以及“大于关系”和“小于关系”,而且也可以 规定任意两个相同间隔的比值或差值。如果将每个数值分别乘以一个正的常数再加上一一个常 数,即进行正线性变换,并不影响定距数据原有的基本信息。因此,常用的统计量如均值、 标准差、相关系数等都可直接用于定距数据。 4、定比变理 定比变量又称为比率(ratio)变量,它与定距变量意义相近,细微差别在于定距变量中 的“0”值只表示某一取值,不表示“没有”。例如,人的身高就是一个定比变量,如果身 高值为“0”米,则表示这个人不存在。而定比变量的“0”值表示“没有”。而在测定温度 的摄氏表 并不表示没有温度,因为还有在零点以下的温度。定比变量的取值称为 比数据或比率数据。定比数据也同样可进行算术运算和线性变换等。通常对定距变量和定比 变量不需再加以区别,两者统称为定距变量或间隔变量。 一般地,定类变量和定序变量用于描述定性数据,属于定性变量:而定距变量和定比变 量用于描述定量数据,属于定量变量。 同其他公举标准一样 一个变量在不同分析中可当作不同尺度的变量。例如,“年龄” 在某些分析中(如回归分析)当作定距变量,而在另外一些分析中(如方差分析)可通过分 组作为定类变量处理。 另外,较高尺度的变量包含了较低尺度变量的性质。定序变量包含了定类变量的所有特 征,定距变量同时包含了定序变量和定类变量的特征。这种性质允许在分析数据时把一些较 高尺度变量作为较低尺度变量处理。例如,定距变量可当作定类变量或定序变量看待,而定 序变量可作为定序变量分析 以上通过三种不同方法对变量进行分类。这些分类是可以重叠的。一个变量可能是离散 型变量、自变量、定类变量(如“最高学历”),也可能是连续型变量、因变量、定距变量(如 “血压”)。按间隙分类和按测量尺度分类的重叠如图1-3所示。 《实用统计分析方法与 SPSS 应用》初稿 / 张文璋 9 此,最常用来综合定类数据的统计量是频数、比率或百分比等。 2、定序变量 定序变量又称为有序(ordinal)变量、顺序变量,它的取值的大小能够表示观测对象的 某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。例如,“最高学历” 变量的取值是:1—小学及以下、2—初中、3—高中、中专、技校、4—大学专科、5—大学 本科、6—研究生以上。由小到大的取值能够代表学历由低到高。定序变量的取值称为定序 数据或有序数据。适合于定序数据的数学关系是“大于(>)”和“小于(<)”关系。在定序 数据中,同一组内各单位是等价的,相邻组之间的单位是不等价的,它们存在“大于”或“小 于”的关系。而且,并进行保序变换(或称单调变换),则不改变数据原有的基本信息即等 级顺序。最适合用于综合定序数据取值的集中趋势的统计量是中位数。 3、定距变量 定距变量又称为间隔(interval)变量,它的取值之间可以比较大小,可以用加减法计算 出差异的大小。例如,“年龄”变量,其取值 60 与 20 相比,表示 60 岁比 20 岁大,并且可 以计算出大 40 岁(60-20)。定距变量的取值称为定距数据或间隔数据。定距数据是一些真 实的数值,具有公共的、不变的测定单位,可以进行加减乘除运算。定距数据的基本特点是 两个相同间隔的数值的差异相等,例如,年龄的 60 岁与 50 岁之差等于 40 岁与 30 岁之差。 对于定距数据,不仅可以规定“等价关系”以及“大于关系”和“小于关系”,而且也可以 规定任意两个相同间隔的比值或差值。如果将每个数值分别乘以一个正的常数再加上一个常 数,即进行正线性变换,并不影响定距数据原有的基本信息。因此,常用的统计量如均值、 标准差、相关系数等都可直接用于定距数据。 4、定比变量 定比变量又称为比率(ratio)变量,它与定距变量意义相近,细微差别在于定距变量中 的“0”值只表示某一取值,不表示“没有”。例如,人的身高就是一个定比变量,如果身 高值为“0”米,则表示这个人不存在。而定比变量的“0”值表示“没有”。而在测定温度 的摄氏表中, C o 0 并不表示没有温度,因为还有在零点以下的温度。定比变量的取值称为定 比数据或比率数据。定比数据也同样可进行算术运算和线性变换等。通常对定距变量和定比 变量不需再加以区别,两者统称为定距变量或间隔变量。 一般地,定类变量和定序变量用于描述定性数据,属于定性变量;而定距变量和定比变 量用于描述定量数据,属于定量变量。 同其他分类标准一样,一个变量在不同分析中可当作不同尺度的变量。例如,“年龄” 在某些分析中(如回归分析)当作定距变量,而在另外一些分析中(如方差分析)可通过分 组作为定类变量处理。 另外,较高尺度的变量包含了较低尺度变量的性质。定序变量包含了定类变量的所有特 征,定距变量同时包含了定序变量和定类变量的特征。这种性质允许在分析数据时把一些较 高尺度变量作为较低尺度变量处理。例如,定距变量可当作定类变量或定序变量看待,而定 序变量可作为定序变量分析。 以上通过三种不同方法对变量进行分类。这些分类是可以重叠的。一个变量可能是离散 型变量、自变量、定类变量(如“最高学历”),也可能是连续型变量、因变量、定距变量(如 “血压”)。按间隙分类和按测量尺度分类的重叠如图 1-3所示