案例1 《计算基本描述统计量》的应用举例 对某地区居民储蓄情况进行调查,所得部分数据见附表。对一次存(取)款金 额变量计算基本描述统计量。有以下两个分析目标, 目标一:计算存(取)款金额的基本描述统计量,并分别对城镇储户和农村储 户进行比较。 目标二:分析储户一次存(取)款的数量是否存在不均衡现象。 为实现上述分析目标,利用基本描述统计分别做如下分析。 1.城镇与农村储户一次存(取)款金额的分析比较 利用居民储蓄调查数据计算存(取)款金额的基本描述统计量,并对城镇储户 和农村储户进行比较。 首先按照户口对数据进行拆分(SplitFile),然后计算存(取)款金额的基本 描述统计量,SPSS操作结果如表1所示。 表1城镇储户和农村储户存(取)款金额的基本描述统计量 Descriptive Statistics 户口 城镇户口 农村户可 存(取)款alid 存(取)款金额alid listwise) Statistic 22% 223 90 ang Statistic 5024 80501l Statistic Statistic 3025 80502 Statistic 2687.2 194.97 Std.Deviation Statistic 5737.566 8816.360 kewness Statistic 4.57 8.31 Std.Error .16 .254 rtosis 26.9 713 Std.Error .324 .503 表1表明,城镇储户的一次平均存(取)款金额(2687.2元)高于农村储户 (1944.97元)。标准差证明了城镇储户存(取)款金额的离散程度低于农村储户
案例 1 《计算基本描述统计量》的应用举例 对某地区居民储蓄情况进行调查,所得部分数据见附表。对一次存(取)款金 额变量计算基本描述统计量。有以下两个分析目标。 目标一:计算存(取)款金额的基本描述统计量,并分别对城镇储户和农村储 户进行比较。 目标二:分析储户一次存(取)款的数量是否存在不均衡现象。 为实现上述分析目标,利用基本描述统计分别做如下分析。 1.城镇与农村储户一次存(取)款金额的分析比较 利用居民储蓄调查数据计算存(取)款金额的基本描述统计量,并对城镇储户 和农村储户进行比较。 首先按照户口对数据进行拆分(SplitFile),然后计算存(取)款金额的基本 描述统计量,SPSS 操作结果如表 1 所示。 表 1 城镇储户和农村储户存(取)款金额的基本描述统计量 Descriptive Statistics 户口 城镇户口 农村户口 存(取)款 金额 Valid N (listwise) 存(取)款金额 Valid N (listwise) N Statistic 223 223 90 90 Range Statistic 50247 80501 Minimum Statistic 3 1 Maxximum Statistic 50250 80502 Mean Statistic 2687.20 1944.97 Std. Deviation Statistic 5737.566 8816.366 Skewness Statistic Std.Error 4.570 .163 8.311 .254 Kurtosis Statistic Std.Error 26.996 .324 73.134 .503 表 1 表明,城镇储户的一次平均存(取)款金额(2687。2 元)高于农村储户 (1944.97 元)。标准差证明了城镇储户存(取)款金额的离散程度低于农村储户
无论城镇储户还是农村储户,存(取)款金额的分布均呈右偏分布(两个偏度统计 量分别为4.57和8.311),且农村的偏斜程度更大些(8.311>4.57):同时 城镇储户和农村储户存(取)款金额均呈尖峰分布(两个峰度统计量分别为 26.996和?3.134),且农村更尖峰。由此可见,城镇储户和农村储户中的大部 分人一次存(取)款金额都低于平均水平,且农村储户表现得更为明显。 2.储户一次存{取)款数量的均衡性分析 分析储户一次存(取)款数量是否存在不均衡现象,可以从分析金额是否有大 量异常值人手。这里,如果假设储户一次存3ó高金额组)后进行频数分析可得,低金额组(即低异常值组)的比例为0%, 高金额组<即高异常值组)的比例为2.2%。异常组的总比例大于理论值0.3%, 因此可以认为存(取)款金额存在一定的不均衡现象。 附表 居民储蓄调查数据表
无论城镇储户还是农村储户,存(取)款金额的分布均呈右偏分布(两个偏度统计 量分别为 4.57 和 8。311),且农村的偏斜程度更大些(8.311>4.57);同时, 城镇储户和农村储户存(取)款金额均呈尖峰分布(两个峰度统计量分别为 26.996 和?3。134),且农村更尖峰。由此可见,城镇储户和农村储户中的大部 分人一次存(取)款金额都低于平均水平,且农村储户表现得更为明显。 2.储户一次存{取)款数量的均衡性分析 分析储户一次存(取)款数量是否存在不均衡现象,可以从分析金额是否有大 量异常值人手。这里,如果假设储户一次存3ó高金额组)后进行频数分析可得,低金额组 (即低异常值组)的比例为 0%, 高金额组<即高异常值组)的比例为 2.2%。异常组的总比例大于理论值 0.3%, 因此可以认为存(取)款金额存在一定的不均衡现象。 附表 居民储蓄调查数据表
存取款金户口(城镇存取款户口(城镇存 取款户口(城花取款户口(城镇 额(元) ,农村=2 农村=2 农村=2) (元) 农村=) 1500 3700 7000 100 5000 100 200 10000 200 100 10000 2500 1000 300 300 3500 600 500 10 18000 100 500 3200 100 2000 480 50 1000 5000 400 100 200 2400 0 200 5 14800 10 200 500 25000 6000 100 100 100 100 300 1000 500 100 3 200 10000 30 50 200 400 200 148 5400 800 10 3 5000 10 3000 500 8000 0 200 500 23900 100 1000 200 1100 500 3268 5000 100 7000 1000 10000 800 g00 50 500 500 1000 1000 1000 3 3000 500 600 00 1000 3 10 20 1200 1000 000 1000 10 900 1200 5000 350 100 2000 10000 20a 3600 300 500 200 1000 500 700
存取款金 额(元) 户口(城镇= 1,农村=2) 存取款金 额(元) 户口(城镇= 1,农村=2) 存取款金 额(元) 户口(城镇= 1,农村=2) 存取款金 额(元) 户口(城镇= 1,农村=2) 1500 1 3700 1 7000 1 100 1 5000 1 100 2 200 1 10000 1 200 1 100 1 10000 1 2500 1 1000 1 300 1 300 1 3500 1 300 1 600 2 300 1 3 1 6500 1 500 1 2000 1 10 1 18000 1 100 1 500 1 8 1 3200 1 100 1 2000 1 20 1 480 1 50 1 1000 1 5000 1 400 1 100 1 200 1 2400 1 300 1 200 1 5000 1 14800 1 10 1 200 1 500 1 25000 1 6000 1 100 1 100 1 100 1 100 1 300 1 1000 1 5000 1 500 1 100 1 3 1 200 1 1000 1 10000 1 2000 1 30 1 10 1 500 1 300 1 1000 1 200 2 400 1 300 1 200 2 6 1 148 1 5400 1 800 2 10 1 3 1 300 1 40 2 5000 1 10 1 3000 1 500 2 8000 1 150 1 20000 1 60 2 300 2 500 1 23900 2 100 2 1000 1 200 1 1100 1 500 2 3268 2 5000 1 100 1 1000 2 7000 1 1000 1 10000 1 800 2 800 1 50 1 500 1 500 2 1000 1 1000 1 5000 1 400 2 1000 1 3 1 3000 1 200 2 500 1 600 1 30000 1 3000 2 1000 1 3 1 5000 1 1000 2 20 1 1200 2 1000 1 5000 2 3 1 1000 1 4600 1 10 2 5 1 900 1 2000 2 8 2 1200 1 5000 1 350 1 50 2 100 1 2000 1 1000 1 10 2 500 1 10000 1 1000 1 5 2 300 1 3600 1 300 1 500 2 200 1 1000 1 500 1 700 2
300 300 3500 50 600 200 1000 500 800 30 100 8000 3000 1000 00 500 00 1000 900 30 30000 100 00 2000 600 800 900 1500 200 300 980 1500 1000 1000 500 2 25000 500 1000 1000 80502 1000 3000 2 1000 200 100 1000 8 1000 20000 2000 100 2 90 600 1000 800 10000d 400 100 20 70 90 50250 5500 150 10000 5500 700 3000 1500 1000 700 2000 3 500 100 5000 1000 200 100 1500 10 1000 4000 500 60 1200 00 10 500 100 700 15000 1300 100 260 4500 200 5000 1500 00 500 20 100 1000 500 600 00 20 2000 5000 100 1000 30 用》 电子 7年4月
300 1 300 1 3500 1 50 2 600 2 200 1 1000 1 5 1 1000 1 500 1 200 1 800 2 30 1 1000 1 1000 1 2 2 8000 1 3000 1 1000 1 9 2 900 1 500 1 5000 1 14 2 1000 1 900 1 3000 1 1000 2 30000 1 100 1 200 1 2000 2 600 1 800 1 900 1 1500 2 200 1 300 1 60 2 980 2 1500 1 1000 2 1000 2 500 2 7000 1 25000 1 1000 2 500 2 1000 1 1000 1 10000 2 1000 2 80502 2 1000 1 3000 2 5 2 3 1 1000 1 200 2 5 2 100 1 1000 1 120 2 8 2 1000 1 20000 1 800 2 6 2 3 1 2000 1 100 2 110 2 90 1 600 2 1000 2 800 2 800 1 10000 1 400 2 1 2 1000 1 20 1 70 2 100 2 90 2 50250 1 1 2 60 2 1000 1 5500 1 400 2 1000 2 1700 1 1500 2 900 2 700 2 10000 1 5500 1 700 2 3000 2 100 1 1500 1 1000 1 700 2 500 1 2000 1 3000 1 500 2 100 1 5000 1 1000 1 200 2 1000 1 1500 1 10 1 1000 2 4000 1 500 1 600 1 1200 2 80 1 200 1 10 1 500 2 100 1 700 1 15000 1 1300 2 100 1 260 1 4500 1 200 2 100 1 5000 1 1500 1 1100 2 200 1 5000 1 500 1 2000 2 100 1 1000 1 500 1 600 2 200 1 3 2 500 2 100 2 400 1 200 1 200 1 2000 1 5000 1 100 1 1000 1 2000 1 3000 1 资料来源:薛薇,《SPSS 统计分析方法及应用》,电子工业出版社,2007 年 4 月