第一章绪论 第一节统计与统计学 一.统计学的含义 ·统计的三种含义 a.指统计数据的搜集活动,即统计工作: b.指统计活动的结果,即统计数据: C.指分析统计数据的方法和技术,即统计学。 ·统计学的含义 .统计学是一门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在数量规 律性,以达到对客观事物的科学认识。 居 是统计学研究的内容之一:统计数据的整理是统计学一个必要的环节: 学,统计学与统计数据有着密不可分的关系,统计学由 套收集和处理统计数据的方法所组成 的与统计方法 一套方法 律距找出其 在的数量 么是统计数据的内在数量规律性?为 大后 的统计数据,利用统计方法是可以探索出其内在的数量规律性的 因为客观事物本身是必然 性知佛铁性的过立结 必然性反映了事物的本质特性,偶然性反映了事物表现形式上的差 异。统计数据作为客观事物的一种数量表现,是事物必然性与偶然性共同作用的结果。偶然 性使得对同一事物的多次观察得到的统计数据有差异,而必然性则隐含在统计数据本身,这 正是我们要利用统计方法去寻找的。 第二节统计学的分科 一,统计学的分类 ·描述统计学 描述统计学研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处 理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。其内容包括统 计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括和分析方 法等。它是整个统计学的基础。 ·推断统计学 推断统计学则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行 描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。它是现代统计学的 主要内容。 ·理论统计学 理论统计学是指统计学的数学原理,它主要研究统计学的一般理论和统计方法的数学理论
第一章 绪论 第一节 统计与统计学 一. 统计学的含义 • 统计的三种含义 a. 指统计数据的搜集活动,即统计工作; b. 指统计活动的结果,即统计数据; c . 指分析统计数据的方法和技术,即统计学。 • 统计学的含义 a. 统计学是一门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在数量规 律性,以达到对客观事物的科学认识。 b. 统计数据的收集是统计学研究的内容之一;统计数据的整理是统计学一个必要的环节; 统计数据的分析是统计学的核心内容。 c . 统计学是一门有关统计数据的科学,统计学与统计数据有着密不可分的关系,统计学由 一套收集和处理统计数据的方法所组成。 • 统计数据的规律与统计方法 统计学提供了探索数据内在规律的一套方法。那么,什么是统计数据的内在数量规律性?为 什么统计方法能通过对数据的分析找出其内在的数量规律性?通过多次观察或试验得到大量 的统计数据,利用统计方法是可以探索出其内在的数量规律性的。因为客观事物本身是必然 性和偶然性的对立统一,必然性反映了事物的本质特性,偶然性反映了事物表现形式上的差 异。统计数据作为客观事物的一种数量表现,是事物必然性与偶然性共同作用的结果。偶然 性使得对同一事物的多次观察得到的统计数据有差异,而必然性则隐含在统计数据本身,这 正是我们要利用统计方法去寻找的。 第二节 统计学的分科 一. 统计学的分类 • 描述统计学 描述统计学研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处 理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。其内容包括统 计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括和分析方 法等。它是整个统计学的基础。 • 推断统计学 推断统计学则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行 描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。它是现代统计学的 主要内容。 • 理论统计学 理论统计学是指统计学的数学原理,它主要研究统计学的一般理论和统计方法的数学理论
·应用统计学 应用统计学是研究如何应用统计方法去解决实际问题。 第三节统计学与其它学科的关系 一.统计学与其它学科的关系 ·统计学与数学的关系 数学研究的是抽象的数量规律,而统计学则是研究具体的、实际现象的数量规律:数学研究 的是没有量纲或单位的抽象的数,而统计学研究的是有具体实物或计量单位的数据。 统计学与数学研究中所使用的逻辑方法是不同的,数学研究所使用的是纯粹的演绎,而统计 学则是演绎与归纳相结合,占主导地位的是归纳。 ·统计学和其他学科的关系 统计学是一门应用性很强的学科。由于几乎所有的学科都要研究和分析数据,因而统计学与 这些学科领域都有或多或少的联系
• 应用统计学 应用统计学是研究如何应用统计方法去解决实际问题。 第三节 统计学与其它学科的关系 一. 统计学与其它学科的关系 • 统计学与数学的关系 数学研究的是抽象的数量规律,而统计学则是研究具体的、实际现象的数量规律;数学研究 的是没有量纲或单位的抽象的数,而统计学研究的是有具体实物或计量单位的数据。 统计学与数学研究中所使用的逻辑方法是不同的,数学研究所使用的是纯粹的演绎,而统计 学则是演绎与归纳相结合,占主导地位的是归纳。 • 统计学和其他学科的关系 统计学是一门应用性很强的学科。由于几乎所有的学科都要研究和分析数据,因而统计学与 这些学科领域都有或多或少的联系
第二章统计数据的收集 第一节数据的计量与类型 一。数据的计量尺度 ·定类尺度(Nominal scale) 定类尺度也称类别尺度或列名尺度,是最粗略、计量层次最低的计量尺度。它只能按照事物 的某种属性对其进行平行的分类或分组。在使用定类尺度对事物进行分类时,必须符合穷尽 和互斥的要求。 ·定序尺度(Ordinal scale) 定序尺度又称顺利尺度,是对事物之间等级差或顺序差别的一种测度尺度。该尺度不仅可以 将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。 ·定距尺度(Interval scale) 定距尺度也称间隔尺度,它不仅能将事物区分为不同类型并进行排序,而且可以准确地指出 类别之间的差距是多少。定距尺度是对事物类别或次序之间间距的测度,它通常使用自然或 度量衡单位作为计量尺度。 ·定比尺度(Ratio scale) 定比尺度也称为比率尺度,它与定距尺度属于同一层次,其计量的结果也可以为数值。它除 了具有上述三种计量出度的全部特性外,还具有一个特性,那就是可以计算两个测度值之间 的比值。 四种计量尺度的比较 计最尺度 数学特性 定类尺度 定序尺度 定距尺度 定比尺度 分类〔=,) L L 排序〔) 间距(+,-) 比值(×,÷) 表2-1 第二节统计数据的来源 一.统计数据的直接来源 1.统计调查的方式
第二章 统计数据的收集 第一节 数据的计量与类型 一. 数据的计量尺度 • 定类尺度( Nominal scale ) 定类尺度也称类别尺度或列名尺度,是最粗略、计量层次最低的计量尺度。它只能按照事物 的某种属性对其进行平行的分类或分组。在使用定类尺度对事物进行分类时,必须符合穷尽 和互斥的要求。 • 定序尺度( Ordinal scale ) 定序尺度又称顺利尺度,是对事物之间等级差或顺序差别的一种测度尺度。该尺度不仅可以 将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。 • 定距尺度( Interval scale ) 定距尺度也称间隔尺度,它不仅能将事物区分为不同类型并进行排序,而且可以准确地指出 类别之间的差距是多少。定距尺度是对事物类别或次序之间间距的测度,它通常使用自然或 度量衡单位作为计量尺度。 • 定比尺度( Ratio scale ) 定比尺度也称为比率尺度,它与定距尺度属于同一层次,其计量的结果也可以为数值。它除 了具有上述三种计量出度的全部特性外,还具有一个特性,那就是可以计算两个测度值之间 的比值。 表 2-1 第二节 统计数据的来源 一. 统计数据的直接来源 1. 统计调查的方式
·普查 普查是为某一特定目的而专门组织的一次性全面调查。它有以下几个特点: a.普查通常是 的或周期性的 一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果 的数据一般比较准确,规范化程度也较高,因此它可以为抽样调查或其他调查提供 基木 d。普查的使用范围比较窄,只能调查一些最基本及特定的现象。 ·抽样调查 抽样 调查是从调查对象的总体中随即抽取一部分单位作为样本进行调查,并根据样本调查结 果来推断总体数量特征的 一种非全面调查。它具有以下几个特点: a.经济性: b.时效性 强:c.适应面 d.准确性高】 数据的一种调查方】 的报送时间和报送程序进行填报。 ·重点调查 重点调查是从调查对象的全部单位中选择少数重点单位进行调查。重点单位是指在所要调查 的数量特征上占有较大比重的单位。 ·典型调查 典型调查是从调查对象的全部单位中选择一个或及格少数有代表性的单位进行全面深入的调 查。 表2一2列出了各种调查方式的比较。 2.数据的搜集方法 ·询词调查 询问调查是调查者与被调查者直接或间接接触以获得数据的一种方法,具体包括访问调查 邮寄调查、电话调查、电脑辅助调查、座谈会、个别深访等。 ·观察与试验 观察与试验是调查者通过直接的观察或试验获得数据的一种方法。包括观察法和试验法
• 普查 普查是为某一特定目的而专门组织的一次性全面调查。它有以下几个特点: a. 普查通常是一次性的或周期性的; b. 普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果 的准确性; c . 普查的数据一般比较准确,规范化程度也较高,因此它可以为抽样调查或其他调查提供 基本依据; d. 普查的使用范围比较窄,只能调查一些最基本及特定的现象。 • 抽样调查 抽样调查是从调查对象的总体中随即抽取一部分单位作为样本进行调查,并根据样本调查结 果来推断总体数量特征的一种非全面调查。它具有以下几个特点: a. 经济性; b. 时效性 强; c . 适应面广; d. 准确性高。 • 统计报表 统计报表是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计 数据的一种调查方式。它要以一定的原始数据为基础,按照统一的表式、统一的指标、统一 的报送时间和报送程序进行填报。 • 重点调查 重点调查是从调查对象的全部单位中选择少数重点单位进行调查。重点单位是指在所要调查 的数量特征上占有较大比重的单位。 • 典型调查 典型调查是从调查对象的全部单位中选择一个或及格少数有代表性的单位进行全面深入的调 查。 表 2-2 列出了各种调查方式的比较。 2. 数据的搜集方法 • 询问调查 询问调查是调查者与被调查者直接或间接接触以获得数据的一种方法,具体包括访问调查、 邮寄调查、电话调查、电脑辅助调查、座谈会、个别深访等。 • 观察与试验 观察与试验是调查者通过直接的观察或试验获得数据的一种方法。包括观察法和试验法
各类统计调查的特点 调查范围 调查时间 组织形式 统计报表全面或非全面 经常 报表制度 梦 查 全面 一时 专门调查 抽样调查 非全面 经常或一时 专门调查 重点调查 非全面 经常或一时 报表或专门 典型调查 非全面 一时 专门调查 表2一2 二.统计数据的间接来源 当无法通过直接的调查或试验取得所需的第一手数据时,可以通过其它渠道获取别人调查或 科学试验的第二手数据。第二手数据主要时公开出版的或公开报道的数据,当然也有些时尚 未公开的数据。 第三节调查方案设计 调查方案大体上都包括调查日的、调查对象和调查单位、调查项目和调查表等内容,其设计 可分为 a.确定调查日的: 口.确定调查对象和调有 及 三个步骤,另外还应明 调查所采用的方式和方法 调查时间 商志文我,情有雨的技市汤通在方装我技6灯家 查组织和实 市场可 查项目和调查表通常表现为一 张 第四节统计数据的质量 。统计数据的误差 统计数据的误差通常是指统计数据与客观现实之间的差距,主要有登记性误差和代表性误 差。统计数据质量的好坏直接影响到统计分析结论的客观性和真实性。 ·统计数据的质量要表 统计数据的质量评价标准分为六个方面: 1,精度,即最低的抽样误差和随即误差 2.准确性,即最小的非抽样误差或偏差: 3.关联性,即满足用户决策、管理和研究的需要: 4.及时性,即在最短的时间里取得并公布数据:
表 2-2 二. 统计数据的间接来源 当无法通过直接的调查或试验取得所需的第一手数据时,可以通过其它渠道获取别人调查或 科学试验的第二手数据。第二手数据主要时公开出版的或公开报道的数据,当然也有些时尚 未公开的数据。 第三节 调查方案设计 调查方案大体上都包括调查目的、调查对象和调查单位、调查项目和调查表等内容,其设计 可分为 a. 确定调查目的; b. 确定调查对象和调查单位; c . 设计调查项目和调查表这三个步骤,另外还应明确调查所采用的方式和方法、调查时间 及调查组织和实施的具体细则等。在市场研究和调查中,调查项目和调查表通常表现为一张 调查文卷。调查问卷的设计是市场调查方案设计的核心内容。 第四节 统计数据的质量 • 统计数据的误差 统计数据的误差通常是指统计数据与客观现实之间的差距,主要有登记性误差和代表性误 差。统计数据质量的好坏直接影响到统计分析结论的客观性和真实性。 • 统计数据的质量要求 统计数据的质量评价标准分为六个方面: 1. 精度,即最低的抽样误差和随即误差; 2. 准确性,即最小的非抽样误差或偏差; 3. 关联性,即满足用户决策、管理和研究的需要; 4. 及时性,即在最短的时间里取得并公布数据;
名段聚使木保挂满促货型牌程货使下,以录经济的方式取得收系
5. 一致性,即保持时间序列的可比性; 6. 最低成本,即在满足以上标准前提下,以最经济的方式取得数据
第三章统计数据的整理和显示 第一节数据的预处理 数据的预处理是在对数据分类或分组之前所做的必要处理,包括数据的审核、筛选、排序 等。 一,数据的审核与筛选 1·对从不同渠道取得的统计数据以及不同类型的统计数据其审核内容和方法都是有所不同 的。 对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。 完整性审核 主要是检查应调查的单位或个人是否有遗漏,所有的调查项日或指标是否填写齐全等。准确 性审核主要包括两个方面: (是地反映了客观实际情况 内容是否符合实际 格查数据是香有储误,计单是香正的等。审核数据准确性的方法主要有逻辑检查和计 财于酒过其它果道取得第二手数据·除了完整性和准确性审核,还应着重审核数据的适用价 父的 或有明显错误的数据予以剔除 ,将符合某种特定条件的数据筛选出米, 对不符合特定条件的数据子以剔除。 二.数据的排序 定距数据和定比数据的排序只有递增和递减两种。 排序后的数据也称为顺序统计量(Order statistics) 第二节品质数据的整理与显示 据主要是做分类整理,对数值型数据则主要是做分组整理 一,定类数据的整理和显示 定类数据木身或是对事物的一种分类,因此在整理时除了要列出所分的举别外,还要计算出 每一类别的频数、频率或比例、比率,同时选择适当的图形进行显示,以便对数据及其特征 有一个初步的了解」 1.频数和顿数分布
第三章 统计数据的整理和显示 第一节 数据的预处理 数据的预处理是在对数据分类或分组之前所做的必要处理,包括数据的审核、筛选、排序 等。 一. 数据的审核与筛选 1 .对从不同渠道取得的统计数据以及不同类型的统计数据其审核内容和方法都是有所不同 的。 对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。完整性审核 主要是检查应调查的单位或个人是否有遗漏,所有的调查项目或指标是否填写齐全等。准确 性审核主要包括两个方面: a .检查数据资料是否真是地反映了客观实际情况,内容是否符合实际; b.检查数据是否有错误,计算是否正确等。审核数据准确性的方法主要有逻辑检查和计算检 查。 对于通过其它渠道取得第二手数据,除了完整性和准确性审核,还应着重审核数据的适用性 和时效性。 2 .数据筛选包括两方面内容: a .将某些不符合要求的数据或有明显错误的数据予以剔除; b.将符合某种特定条件的数据筛选出来,对不符合特定条件的数据予以剔除。 二. 数据的排序 数据排序是按一定顺序将数据排序。对于定类数据,如果是字母型数据,排序有升序和降序 之分;如果是汉字型数据,可按汉字首位拼音字母排列,也可按笔画排序。 定距数据和定比数据的排序只有递增和递减两种。 排序后的数据也称为顺序统计量( Order statistics ) 第二节 品质数据的整理与显示 数据经过预处理后,可进一步作分类或分组整理。在对数据进行整理时,首先要弄清数据的 类型,因为对于不同类型的数据所采取的处理方式和所使用的处理方法是不同的。对品质数 据主要是做分类整理,对数值型数据则主要是做分组整理。 一.定类数据的整理和显示 定类数据本身就是对事物的一种分类,因此在整理时除了要列出所分的类别外,还要计算出 每一类别的频数、频率或比例、比率,同时选择适当的图形进行显示,以便对数据及其特征 有一个初步的了解。 1.频数和频数分布
·频数(Frequency)。频数也称次数,时落在各类别中的数据个数。把各个类别及其 相应的频数全部列出来就是频数分布或次数分布(Frequency distribution),将频数 分布用表格的形式表现出来就是频数分布表。 ·比例(Proportion)。比例是一个总体中各个部分的数量占总体数量的比重,通常用 于反映总体的构成或结构。 ·百分比(Percentage)。将比例乘以l00就是百分比或百分数。 ·比率(Ratio)。比率是各不同类别的数量的比值。 2.定类数据的图示 反映定类数据的图示方法主要有条形图和圆形图, ·条形图(Bar chart)·条形图是用宽度相同的条形的高度或长短来表示数据变动的图 形,可以横置或纵置。 下图即为一横置的条形图。 人 10 人人 图3-1 ·圆形图(Pie chart)。圆形图也称饼图,是用圆形及圆内扇行的面积米表示数值大小 的图形。圆形图主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有 用。下图为一饼图示例
• 频数( F requency )。频数也称次数,时落在各类别中的数据个数。把各个类别及其 相应的频数全部列出来就是频数分布或次数分布( F requency distribution )。将频数 分布用表格的形式表现出来就是频数分布表。 • 比例( Propor tion )。比例是一个总体中各个部分的数量占总体数量的比重,通常用 于反映总体的构成或结构。 • 百分比( Per centage )。将比例乘以 100 就是百分比或百分数。 • 比率( Ratio )。比率是各不同类别的数量的比值。 2.定类数据的图示 反映定类数据的图示方法主要有条形图和圆形图。 • 条形图( Bar char t )。条形图是用宽度相同的条形的高度或长短来表示数据变动的图 形,可以横置或纵置。 下图即为一横置的条形图。 图 3 - 1 • 圆形图( Pie char t )。圆形图也称饼图,是用圆形及圆内扇行的面积来表示数值大小 的图形。圆形图主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有 用。 下图为一饼图示例
某城市居民关注不同类型广告的人数构成 5%1% 口商品广告 ■服务告 口金融广告 口房地产广告 23 ■招牛松聘广告 ▣其他广告 图3-2 二定序数据的整理和显示 对鹿数。除了可用定数的整理和显示方法外,还可以计计贸数和聚计频中 1.累积频数和累计频 累积频数 Cumulative frequencies 香类别的 种方法 一是从类别顺序的开始 方相类别顺序的 受后 (定距数类 型是从变量食小 序的变量值 始 提数 例3一1.住房问题的研究中,研究人员在甲、乙两个城市各抽样调查300户家庭,其中 的一个问题是:“您对您家庭目前的住房状况是否满意? (1)非常不满意:(2)不满 意2所)一极:(4)满意:(5)非宿满意:调查结架经整理如表3-1和表3
图 3 - 2 二.定序数据的整理和显示 对于定序数据,除了可用定类数据的整理和显示方法外,还可以计算累计频数和累计频率 (百分比)。 1. 累积频数和累计频率 累积频数( Cumulative f requencies ) 就是将各类别的频数逐级累加起来。有两种方法:一是从类别顺序的开始一方相类别顺序的 最后一方累加频数(定距数据和定比数据则是从变量值小的一方向变量值大的一方累加频 数),称为向上累积;二是从类别顺序的最后一方向类别顺序的开始一方累加频数(定距数 据和定比数据则是从变量值大的一方向变量值小的一方累加频数),称为向下累积。 累积频率或百分比 ( Cumulative per centages ) 就是将各类别的百分比逐级累加起来,也有向上累积和向下累积两种方法。 例 3-1.住房问题的研究中,研究人员在甲、乙两个城市各抽样调查 300 户家庭,其中 的一个问题是:“您对您家庭目前的住房状况是否满意?”( 1 )非常不满意;( 2 )不满 意;( 3 )一般;( 4 )满意;( 5 )非常满意; 调查结果经整理如表 3 - 1 和表 3 - 2 所示
甲城市家庭对住房状况的评价 甲城市 回答类别 白数(户 百分此 向上累积 向下累积 (%) 户数(户)百分此(%)户数(户)百分此(%) 非常不茜音 4 8 24 8.0 300 100 不满意 108 36 132 44.0 276 92 -盼 03 31 225 75.0 168 56 满意 45 15 270 90.0 25 非常满意 30 10 300 100.0 30 10 合计 300100 表3-1 乙城市家庭对住房状况的评价 7城市 回答类别 百分此 向上累积 向下累积 白数(户 (%) 户数(户)百分此(%)户数(户)百分此(%) 非常不满意 21 7.0 21 7.0 300 100.0 不满意 99 33.0 120 40.0 279 93.0 78 26.0 198 66.0 180 60.0 满音 64 213 262 87.3 102 34.0 非常满意 38 12.7 300 100.0 38 12.7 合计 300100.0 表3-2 2.定序数据的图示 累积频数分布图: ,根据累积频数或累积须率, 可以绘制累积频数或频辛 。例如 绘制的累积 颜率分布图 276 200 225 2166 数 00 132 (P) 0 下满 不君 图3-
表 3-1 表 3-2 2. 定序数据的图示 累积频数分布图:累积频数分布图。根据累积频数或累积频率,可以绘制累积频数或频率 分布图。例如,根据甲城市数据绘制的累积频率分布图如下图所示: 图 3-3