第六章样本及其抽样分布 第1节总体与样本
第六章 样本及其抽样分布 第1节 总体与样本
数理统计学是一门以数据为基础的 学科. 数理统计学的任务就是如何获得样 本和利用样本,从而对事物的某些未知 方面进行分析、推断并作出一定的决策
数理统计学是一门以数据为基础的 学科. 数理统计学的任务就是如何获得样 本和利用样本,从而对事物的某些未知 方面进行分析、推断并作出一定的决策。 3
例如:生产厂家声称他们生产的灯泡平均寿命不低于 600小时,如何验证厂家说法的真伪?由于灯泡寿命试 验是破坏性试验,不可能把整批灯泡逐一检测,只能抽 取一部分灯泡进行检验,通过这部分灯泡的寿命数据来 推断整批灯泡的平均寿命。以部分数据信息来推断整体 未知参数,就是数理统计研究问题的基 本方式
例如:生产厂家声称他们生产的灯泡平均寿命不低于 6000小时,如何验证厂家说法的真伪?由于灯泡寿命试 验是破坏性试验,不可能把整批灯泡逐一检测,只能抽 取一部分灯泡进行检验,通过这部分灯泡的寿命数据来 推断整批灯泡的平均寿命。以部分数据信息来推断整体 未知参数,就是数理统计研究问题的基 本方式。 4
总体:研究对象的全体;或试验全部观察值 个体:总体中的成员/每个可能的观察值 总体的容量:总体中包含的个体数; 有限总体:容量有限的总体; 无限总体:容量无限的总体,通常将容量非 常大的有限总体也按无限总体处理
• 总体:研究对象的全体;或试验全部观察值 • 个体:总体中的成员/每个可能的观察值 • 总体的容量:总体中包含的个体数; • 有限总体:容量有限的总体; • 无限总体:容量无限的总体,通常将容量非 常大的有限总体也按无限总体处理。 5
例:1)了解某校大学生“做过家教(包括 正在做家教)”的比例。 总体是该校大学生全体。这是一个有限总 体,每个大学生有许多指标,比如性别, 年龄,身高,体重,高考成绩…。现在我 们关心的是学生是否“做过家教”这一指 标
6 • 例:1)了解某校大学生“做过家教(包括 正在做家教)”的比例。 总体是该校大学生全体。这是一个有限总 体,每个大学生有许多指标,比如性别, 年龄,身高,体重,高考成绩…。现在我 们关心的是学生是否“做过家教”这一指 标
·2)了解某城市的空气质量情况,关注该城 市的PM2.5值。总体是城市上空一定范围内 的空气,这是一个无限总体,描述空气质量 有许多指标,而我们仅关心PM2.5值。 3)药厂研究某种药物在人体中的吸收情况。 总体是全体国民,这是一个有限总体,但数 量非常巨大,我们常把它看成无限总体
• 2)了解某城市的空气质量情况,关注该城 市的PM2.5值。总体是城市上空一定范围内 的空气,这是一个无限总体,描述空气质量 有许多指标,而我们仅关心PM2.5值。 7 • 3)药厂研究某种药物在人体中的吸收情况。 总体是全体国民,这是一个有限总体,但数 量非常巨大,我们常把它看成无限总体
为了采用数理统计方法进行分析,首先要 收集数据,数据收集方法一般有两种。 (1)通过调查、记录收集数据。如为了调查 大学生是否“做过家教”,可以进行问卷调 查;要了解PM2.5值,需要在城市设立若干监 测站点,定时收集PM2.5数据
8 为了采用数理统计方法进行分析,首先要 收集数据,数据收集方法一般有两种。 (1)通过调查、记录收集数据。如为了调查 大学生是否“做过家教”,可以进行问卷调 查;要了解PM2.5值,需要在城市设立若干监 测站点,定时收集PM2.5数据
(2)通过实验收集数据。如为了了解药物吸 收情况,首先要进行试验设计,并征集若干 志愿者,按试验设计方案将他们分成若干组 监测他们服药后不同时间点身体中药物含量 记录相应的数据。 关于数据的收集(调查数据和实验数据 可以根据数据本身的特点有多种不同的方法 和设计,有专门的课程讲授,本课程不作详 细介绍
9 (2)通过实验收集数据。如为了了解药物吸 收情况,首先要进行试验设计,并征集若干 志愿者,按试验设计方案将他们分成若干组, 监测他们服药后不同时间点身体中药物含量, 记录相应的数据。 关于数据的收集(调查数据和实验数据) 可以根据数据本身的特点有多种不同的方法 和设计,有专门的课程讲授,本课程不作详 细介绍
实际中人们通常只关注总体的某个(或几个) 指标。 总体的某个指标X,对于不同的个体来说有不 同的取值,这些取值构成一个分布,因此X可 以看成一个随机变量 有时候直接将X称为总体.假设X的分布函数 为F(x),也称总体X具有分布F(x)
• 实际中人们通常只关注总体的某个(或几个) 指标。 • 总体的某个指标X, 对于不同的个体来说有不 同的取值, 这些取值构成一个分布, 因此X可 以看成一个随机变量. • 有时候直接将X称为总体. 假设X的分布函数 为F(x), 也称总体X具有分布F(x). 10
例1:了解某校学生“做过家教”的情况, 对每个学生来说,以{X=1}表示“做过家 教”,以{X=0}表示“未做过家教”,则总体 X~B(1,p), p是全校学生中做过家教所占的比例,未知 即P(X=x)=p(1-p)2,x=0,1
11 1 ( ) (1 ) , 0,1. x x P X x p p x − 即 = = − = { 1} { 0} X X = = :了解某校学生“做过家教”的情况, 对每个学生来说,以 表示“做过家 教” ,以 表示“未做过家教 例1 ” ,则总体 ~ (1, ), p X B p 是全校学生中做过家教所占的比例,未知