
第六节收集、整理和分析数据的方法一统计主要内容:一、问题的引入二、总体和样本三、统计量和统计量的分布
收集、整理和分析数据的方法 统计 第六节 主要内容: 一、问题的引入 二、总体和样本 三、统计量和统计量的分布

问题的引入由前几节的学习我们看到,概率是描述某事件发生可能性大小的一个数,其值是确定的.而社会现象中有些结果并不能准确地再现.如电视台统计收视率的问题,收视率只能是通过调查数千观众推断出来的结论
由前几节的学习我们看到,概率是描 述某事件发生可能性大小的一个数,其 值是确定的.而社会现象中有些结果并 不能准确地再现.如电视台统计收视率 的问题,收视率只能是通过调查数千 观众推断出来的结论. 一、问题的引入

历史的典籍明叉明安元出家迎中中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明但是当时人们很早就开始了统计的工作.的统计,只是对有关事实的简单记录和整理近代统计则是通过研究整体的一部分来推断整体的特征
历史的典籍 中,人们不难 发现许多关于 钱粮、户口、地震、水灾等等的记载,说明 人们很早就开始了统计的工作. 但是当时 的统计,只是对有关事实的简单记录和整理. 近代统计则是通过研究整体的一部分来推 断整体的特征

统计是一门学科描述统计是对整个总体的调查与描述.人们对所得到的数据进行归类、整理,再计算出反映这些数据特征的一些指标,如平均值、方差等以便对这些数据进行描述,但并不对更大范围统计的数据作出结论推断统计通过研究所想了解的全体中相对较少的量作为代表样本,并从这些代表样本中得出关于全体的结论.即,以掌握的局部资料对整体情况作出分析和推断.文称推断统计
是对整个总体的调查与描述.人们对 所得到的数据进行归类、整理,再计算出反映 这些数据特征的一些指标,如平均值、方差等, 以便对这些数据进行描述,但并不对更大范围 的数据作出结论. 通过研究所想了解的全体中相对较 少的量作为代表样本,并从这些代表样本中, 得出关于全体的结论.即,以掌握的局部资料 对整体情况作出分析和推断.又称推断统计. 统 计 描述统计 推断统计 统计是一门学科

总体和样本二定义把研究对象的全体组成的集合称为总体,用表示,组成总体的每个元素称为个体例如,要了解1998年普通高校招生统考政治科的280万名考生的成绩分布状况,这280万名考生成绩构成一个总体每名考生的成绩为一个个体从总体中取部分个体叫抽样,把抽到的部分个体叫样本,样本中的个数叫样本容量把的n次观测量X,X,叫做来自的容量为n的样本
二、总体和样本 把研究对象的全体组成的集合称为总体,用 x 表示,组成总体的每个元素称为个体. 要了解1998年普通高校招生统考政治科的 280万名考生的成绩分布状况,这280万名 考生成绩构成一个总体, 每名考生的成绩为一个个体. 定义 例如, 从总体x 中取部分个体叫抽样, 把抽到的部 分个体叫样本,样本中的个数叫样本容量, 把x 的n次观测量X1 , . ,Xn叫做来自 x 的容 量为n的样本

某班大学生的身高构成一个总体每位同学的身高是个体从总体中抽取部分个体叫抽样,把抽到的部分个体叫样本1.67m样本中的个数叫样本容量:51.79m,1.62m,1.65m,1.70m,1.68m总体的n次观测(X,",X)叫做来自的容量为n的样本每一个个体X与总体具有同一分布且X,X是相互独立的随机变量
某班大学生的身高 构成一个总体 每位同学的身高是 个体 从总体中抽取部分个体叫抽样, 把抽到的部分个体叫样本 样本中的个数叫样本容量:5 总体x 的n次观测(X1 , . ,Xn) 叫做来自 x 的容量为n的样本. (x1 , .,xn )叫做样本观察值. (1.79m,1.62m,1.65m,1.70m,1.68m) 1.79m, 1.62m,1.65m, 1.70m,1.68m 1.67m 每一个个体Xi 与总体x 具有同一分布, 且X1 , . ,Xn是相互独立的随机变量

三统计量和统计量的分布设(X,X,)是取自总体的一个样本定义称不含任何总体未知参数的样本函数(X...,X,) 为统计量,几个常见统计量Zx=X样本平均数ni=l前面提到的身高问题(1.79m,1.62m,1.65m,1.70m,1.68m)样本平均数lx=(1.79 + 1.62 + 1.65 + 1.70 + 1.68) = 1.688(m)5nZ(X,-X)S2样本方差n-li=1
三、统计量和统计量的分布 几个常见统计量: 1 1 n i i X X n = = 2 2 1 1 ( ) 1 n i i S X X n = = − − 样本平均数 样本方差 定义 设 是取自总体x的一个样本, 称不含任何总体未知参数的样本函数 1 ( ,., ) X X n 1 ( ,., ) X X n 为统计量. 前面提到的身高问题,(1.79m,1.62m,1.65m,1.70m,1.68m) 1 (1.79 1.62 1.65 1.70 1.68) 1.688(m). 5 样本平均数 x = + + + + =

利用期望值与方差的性质可以求出 EX,DX(x)-1Zx)-_E(EXEX =E二nni=lni=11=unu=n1(x)-DX,DX,= 1DX = Dni=1i=l1hn若总体的期望值与方差分别是μ,2样本平均数的期望值与总体的期望值相等同时看到,样本平均数X的方差只是总体方差的n分之一,由于方差越小精确度越高,所以它是很重要的一个统计量
利用期望值与方差的性质可以求出 EX DX , . 1 1 n i i EX E X n = = 1 1 1 1 n n i i i i E X EX n n = = = = 1 n . n = = 1 1 n i i DX D X n = = 2 1 1 n i i DX n = = 2 2 1 1 2 n . n n = = 若总体x 的期望值与方差分别是 μ,σ 2 , 2 1 1 n i i DX n = = 样本平均数的期望值与总体x 的期望值相等, 同时看到,样本平均数 的方差只是总体方差 的n分之一,由于方差越小精确度越高,所以 它是很重要的一个统计量. X

由前面的讨论,可以得到关于又的分布定理参数(不确定的数)设总体 ≤~M(u,α),(X,X2,,X,)是定理来自的一个样本,则 X~IN(u,~n正态分布X-μ由上定理,可得UN(0,1)-a/ /n标准正态分布还可以证明ES2 =
由上定理,可得 由前面的讨论,可以得到关于 X 的分布定理. 定理 设总体 , 2 x N( , ) (X1 ,X2 , . ,Xn)是 来自x 的一个样本, 则 2 X N~ ( , ). n ~ (0,1) X U N n − = 还可以证明 ES 2 = σ2 . 标准正态分布 正态分布 参数(不确定的数)

n取不同值时样本均值x的分布f(x)n=16n=9Rn=4n=1+X0
n取不同值时样本均值 X 的分布 o x f x( ) 9 4 n 16 n n = = = n = 1