第三章社会统计资料的整理 第一节统计分组的原则与标准 “穷举”与“互斥”·频数(或次数)分布数列·品质数列(定类和定序)与 变量(定距)数列 第二节统计表 统计表的格式、内容与种类·统计表的制作规则 第三节变量数列的编制 离散变量数列与连续变量数列·单项数列与组距数列咀距和组数的确定·等 距分组与异距分组·开口组与闭口组·频数密度与标准组距频数·累计频数 第四节统计图 频数分布曲线(直方图、折线图、曲线图)·累计频数分布曲线·洛仑兹曲 线与基尼系数 填空 1.统计表从内容上看,是由()和宾词两部分构成的。 2.主词是统计表要说明的 );宾词是用来说明主词的( 3.变量数列有两个构成要素 )和( 4.基尼系数为( ),表示收入绝对不平均;基尼系数为( 入绝对平均。 5.统计表通常有一定格式,统计表各部位的名称分别是( )、横行标题、纵栏 标题、( 6.实际收入分配情况则由洛仑兹曲线表示,一般表现为一条下凹的弧线,下凹程度愈 大,收入分配( ),反之,则收入分配( 7.对于连续变量,恰是某一组限的数据应按照( 的原则归入相应的组别 8.统计表按主词的分组情况,可分为简单表、简单分组表和 9.统计分组的关键在于( )和划分各组界限 、单项选择题 统计表的数字部分中符号“……”代表的含义是()。 A.某项数字不存在 B.缺少某项数字 C.某项数字较大 提醒注意核计 2.某城市男性青年27岁结婚的人最多,该城市男性青年结婚年龄为262岁,则该城
1 第三章 社会统计资料的整理 第一节 统计分组的原则与标准 “穷举”与“互斥”·频数(或次数)分布数列·品质数列(定类和定序)与 变量(定距)数列 第二节 统计表 统计表的格式、内容与种类·统计表的制作规则 第三节 变量数列的编制 离散变量数列与连续变量数列·单项数列与组距数列·组距和组数的确定·等 距分组与异距分组·开口组与闭口组·频数密度与标准组距频数·累计频数 第四节 统计图 频数分布曲线(直方图、折线图、曲线图)·累计频数分布曲线·洛仑兹曲 线与基尼系数 一、填空 1.统计表从内容上看,是由( )和宾词两部分构成的。 2.主词是统计表要说明的( );宾词是用来说明主词的( )。 3.变量数列有两个构成要素( )和( )。 4.基尼系数为( ),表示收入绝对不平均;基尼系数为( ),表示收 入绝对平均。 5.统计表通常有一定格式,统计表各部位的名称分别是( )、横行标题、纵栏 标题、( )。 6.实际收入分配情况则由洛仑兹曲线表示,一般表现为一条下凹的弧线,下凹程度愈 大,收入分配( ),反之,则收入分配( )。 7.对于连续变量,恰是某一组限的数据应按照( )的原则归入相应的组别。 8.统计表按主词的分组情况,可分为简单表、简单分组表和( )。 9.统计分组的关键在于( )和划分各组界限。 二、单项选择题 1. 统计表的数字部分中符号“……”代表的含义是( )。 A.某项数字不存在 B.缺少某项数字 C.某项数字较大 D.提醒注意核计 2. 某城市男性青年 27 岁结婚的人最多,该城市男性青年结婚年龄为 26.2 岁,则该城
市男性青年结婚的年龄分布为( A.正偏 B.负偏 C.对称 D.不能作出结论 3.上限与下限之差是( A.组限 C.组中值 极差 4.累计频数分布曲线一般都呈( A.钟型曲线 B.U型曲线 C.J型曲线 D.逻辑斯蒂曲线 三、多项选择题 1.累计频数分布曲线( A.只有持续增长或持续减少两种形状 B.呈对称的钟型 C.一般呈S状 D.斜率为零处对应于空组 E.曲线最高处对应于含有最多单位的间距 2.如果某连续变量的数值分布很不均匀,且有极端值出现,则数列应编制( A.开口组 B.闭口组 C.等距数列 D.异距数列 E.单项式数列 3.统计表从格式上看,可以分为( )等部分 A.总标题 B.主词 C.宾词 D.横行、纵栏标题 E.指标数值 四、判断题 对于直方图,如果矩形的总面积为1,各矩形的面积必定等于各组的相对频数。 2.洛仑兹曲线一般表现出为一条下凹的曲线,下凹的程度愈大,收入分配愈平均 3.将收集到得的数据分组,组数越多,丧失的信息越多 4.离散变量既可编制单项式变量数列,也可编制组距式变量数列 五、名词解释 1.统计分组 2.统计表 3.洛仑兹曲线 4.基尼系数 六、应用题 1.指出下表格各部分的名称
2 市男性青年结婚的年龄分布为( )。 A.正偏 B.负偏 C.对称 D.不能作出结论 3. 上限与下限之差是( )。 A.组限 B.组距 C.组中值 D.极差 4.累计频数分布曲线一般都呈( )。 A.钟型曲线 B.U 型曲线 C.J 型曲线 D.逻辑斯蒂曲线 三、多项选择题 1.累计频数分布曲线( )。 A.只有持续增长或持续减少两种形状 B.呈对称的钟型 C.一般呈 S 状 D.斜率为零处对应于空组 E.曲线最高处对应于含有最多单位的间距 2.如果某连续变量的数值分布很不均匀,且有极端值出现,则数列应编制( )。 A.开口组 B.闭口组 C.等距数列 D.异距数列 E.单项式数列 3.统计表从格式上看,可以分为 ( )等部分。 A.总标题 B.主词 C.宾词 D.横行、纵栏标题 E.指标数值 四、判断题 1.对于直方图,如果矩形的总面积为 1,各矩形的面积必定等于各组的相对频数。 ( ) 2.洛仑兹曲线一般表现出为一条下凹的曲线,下凹的程度愈大,收入分配愈平均。 ( ) 3.将收集到得的数据分组,组数越多,丧失的信息越多。 ( ) 4.离散变量既可编制单项式变量数列,也可编制组距式变量数列。 ( ) 五、名词解释 1.统计分组 2.统计表 3.洛仑兹曲线 4.基尼系数 六、应用题 1.指出下表格各部分的名称
2002年我国城乡人口情况 按城乡分 人口数(万人) 比重(%) 城镇 50212 乡村 △ 128453 100.00 2.将上表画成直方图和折线图 3.简述制作表格的注意事项。 4.已知某社区50名退休老人的年龄如下: 81、56、76、67、79、62、72、61、77、62 80、59、62、59、83、68、63、70、69、59 56、58、77、57、72、65、65、61、73、79 试编一频数分布数列(要求:第一组下限取56:组距取4)。 5.简述编制离散数列和连续数列组距的不同之处
3 2002 年我国城乡人口情况 按城乡分 人口数(万人) 比重(%) 城镇 乡村 50212 78241 39.09 60.91 合计 128453 100.00 2.将上表画成直方图和折线图 3.简述制作表格的注意事项。 4.已知某社区 50 名退休老人的年龄如下: 81、 56、 76、 67、 79、 62、 72、 61、 77、 62 60、 73、 65、 58、 70、 60、 59、 69、 58、 68 80、 59、 62、 59、 83、 68、 63、 70、 69、 59 64、 75、 66、 74、 65、 87、 58、 81、 68、 63 56、 58、 77、 57、 72、 65、 65、 61、 73、 79 试编一频数分布数列(要求:第一组下限取 56;组距取 4)。 5.简述编制离散数列和连续数列组距的不同之处
参考答案 填空 1.主词2、对象,标志和标志值3.变量值,频数 5.总标题,统计数值6.愈不平均,愈平均7.上组限不包括在内 8.复合分组表9.选择分组标志 二、单项选择题 三、多项选择题 ACD 2. AD 3. ADE 四、判断题 (√)2.(×)3.(×)4.(√) 五、名词解释 1.所谓统计分组.就是按统计研究的目的和要求,将总体单位或全部调查数据按一定 的标志划分成若干组,使组内差异尽量小,而组与组之间则有明显差异,从而使原本杂乱无 章的资料有序化,以便为在统计分析中提炼各种有用信息打下基础 2.统计表是表示统计资料的表格,在由横行、纵栏交叉结合而成的表格上,它能系统 地组织和合理地安排大量数字资料。统计表的主要功用是汇总和积累统计资料,以简捷和有 条理的方式表示统计资料的特征,从而使统计资料易于查对、比较、分析和记忆。 3.洛仑兹曲线是一种用来反映社会收入分配平均程度的累计百分数曲线。洛仑兹曲线 的特点是在纵轴和横轴两个方向上都进行累计 4.20世纪初意大利经济学家基尼(Gin)根据洛仑兹曲线提出了一种判断社会收入分配 平均程度的指标,用G表示。设实际收入分配曲线和收入分配绝对平均线之间的面积为A 实际收入分配曲线右下方的面积为B,并以A除以A+B的商表示不平均程度,这个数值被 称为基尼系数。 六、应用题 1.答:总标题“2002年我国城乡人口情况”,横行标题(表侧)如“城镇”、纵栏标题(表 头)如“人口数”、统计数值(表身)如“78241”。 2.(略) 3.统计表的制作,为了达到紧凑明确的目的,发挥表格应有功能,必须注意以下几条 规则: (1)标题部分(略) (2)栏目部分(略) (3)线格部分(略) (4)数字部分(略)
4 参考答案 一、填空 1.主词 2、对象,标志和标志值 3.变量值,频数 4.1,0 5.总标题,统计数值 6.愈不平均,愈平均 7.上组限不包括在内 8.复合分组表 9.选择分组标志 二、单项选择题 1.B 2.B 3.A 4.D 三、多项选择题 1.A C D 2.A D 3.A D E 四、判断题 1.( √) 2.( × ) 3.( × ) 4.( √ ) 五、名词解释 1.所谓统计分组.就是按统计研究的目的和要求,将总体单位或全部调查数据按一定 的标志划分成若干组,使组内差异尽量小,而组与组之间则有明显差异,从而使原本杂乱无 章的资料有序化,以便为在统计分析中提炼各种有用信息打下基础。 2.统计表是表示统计资料的表格,在由横行、纵栏交叉结合而成的表格上,它能系统 地组织和合理地安排大量数字资料。统计表的主要功用是汇总和积累统计资料,以简捷和有 条理的方式表示统计资料的特征,从而使统计资料易于查对、比较、分析和记忆。 3.洛仑兹曲线是一种用来反映社会收入分配平均程度的累计百分数曲线。洛仑兹曲线 的特点是在纵轴和横轴两个方向上都进行累计。 4.20 世纪初意大利经济学家基尼(Gini)根据洛仑兹曲线提出了一种判断社会收入分配 平均程度的指标,用 G 表示。设实际收入分配曲线和收入分配绝对平均线之间的面积为 A, 实际收入分配曲线右下方的面积为 B,并以 A 除以 A+B 的商表示不平均程度,这个数值被 称为基尼系数。 六、应用题 1.答:总标题“2002 年我国城乡人口情况”,横行标题(表侧)如 “城镇”、纵栏标题(表 头)如“人口数”、统计数值(表身)如“78241”。 2.(略) 3.统计表的制作,为了达到紧凑明确的目的,发挥表格应有功能,必须注意以下几条 规则: (1)标题部分(略) (2)栏目部分(略) (3)线格部分(略) (4)数字部分(略)
岁数 频数 累计频数F 56-60 60—64 64-68 68-72 76-80 977654 80-84 5.离散变量的整数值如果变动幅度较小,可以将每一个变量值列为一组,编制单项数 列:离散变量的整数值如果变动幅度较大,而且总体单位数N又很大,则要编制组距数列, 连续变量因其数学特征,在一个区间可以有无限多数值,无法按顺序一一列举,所以只 能编制组距数列。与离散变量组距数列不同之处在于,根据连续变量的特征,此时组距数列 中相邻两组的上限和下限共有一个组限,即相邻两组交界处的组限重合
5 4. 岁数 频数 累计频数 F 56―60 60―64 64―68 68―72 72―76 76―80 80―84 84―88 11 9 7 7 6 5 4 1 11 20 27 34 40 45 49 50 合计 50 —— 5.离散变量的整数值如果变动幅度较小,可以将每一个变量值列为一组,编制单项数 列;离散变量的整数值如果变动幅度较大,而且总体单位数 N 又很大,则要编制组距数列。 连续变量因其数学特征,在一个区间可以有无限多数值,无法按顺序一一列举,所以只 能编制组距数列。与离散变量组距数列不同之处在于,根据连续变量的特征,此时组距数列 中相邻两组的上限和下限共有一个组限,即相邻两组交界处的组限重合