§6.1总体与样本 >三、 >。讲长与课断
§6.1总体与样本 、总体 般我们把研究对象的全体称为总体(或母体),而 把每一个研究对象称为个体.例如,在研究某灯泡厂生产 的灯泡质量时,该厂生产的灯泡全体构成的一个总体,其 中每只灯泡都是个体;研究某班高等数学课程的成绩时 该班每个同学都是个体,全体同学构成一个总体 工工工 在实际问题中,人们主要关心的往往是研究对象的某 个(或某些)数量指标及其在总体中的分布情况.如研究 灯泡的质量时,关注的是灯泡的使用寿命这一指标;在研 王学的体质时则卡表心的是大学生的身高体哪、 值,那么,所有个体的这些指标值就形成一个集合,该集 合包含了研究指标在总体中的所有可能取值 王页下
§6.1 总体与样本 一、总体 一般我们把研究对象的全体称为总体(或母体),而 把每一个研究对象称为个体. 例如,在研究某灯泡厂生产 的灯泡质量时,该厂生产的灯泡全体构成的一个总体,其 中每只灯泡都是个体;研究某班高等数学课程的成绩时, 该班每个同学都是个体,全体同学构成一个总体. 在实际问题中,人们主要关心的往往是研究对象的某 个(或某些)数量指标及其在总体中的分布情况. 如研究 灯泡的质量时,关注的是灯泡的使用寿命这一指标;在研 究大学生的体质时,则主要关心的是大学生的身高、体重、 视力等指标. 由于每个个体都有一个(或多个)数量指标 值,那么,所有个体的这些指标值就形成一个集合,该集 合包含了研究指标在总体中的所有可能取值.
王比如,某厂灯泡的寿命指标,其所有可能的取值 就是所有具体灯泡寿命值;某班的高等数学成绩 这一指标的取值就是该班所有同学的高等数学成 绩,数理统计中,我们关心的并不是每个个体的 具体指标特征,而关心的正是象某厂灯泡寿命 某班高数成绩这样的总体指标特征.要研究总体 的指标,就要进行试验或观察由于预先不知道 观察到的是哪个个体,因而观察到的相应指标值 午就不能面先确定完全是随机的这样:总体 在总体中的分布状况.于是,在数理统计中就 总体定义为服从某一分布的随机变量X(数 槔秀应随薪楼鑫布愁况婕的合布而面到的 牛廝有个体的指标值集合就是总体X的所有可能取 上页
比如,某厂灯泡的寿命指标,其所有可能的取值 就是所有具体灯泡寿命值;某班的高等数学成绩 这一指标的取值就是该班所有同学的高等数学成 绩.数理统计中,我们关心的并不是每个个体的 具体指标特征,而关心的正是象某厂灯泡寿命、 某班高数成绩这样的总体指标特征.要研究总体 的指标,就要进行试验或观察. 由于预先不知道 观察到的是哪个个体,因而观察到的相应指标值 也就不能预先确定,完全是随机的,这样,总体 的指标就是一个随机变量,其分布完全描述了指 标在总体中的分布状况.于是,在数理统计中就 把总体定义为服从某一分布的随机变量X(数量 指标),其概率分布称为总体的分布,而每个个 体对应随机变量X一个具体观察值.前面谈到的 所有个体的指标值集合就是总体X的所有可能取 值的集合.
A一、样本 我们知道,研究总体离不开研究它的体.但 在许多实际问题中,不可能对所有个体逐一进行 研究,而只能从总体中抽取一部分个体进行观察 c(或试验),根据对这部分个体的观察结果来推 断总体的分布情况, 工工工 一般地,如果从总体中按一定规则抽取n个 个体进行观察(或试验),则称这n个个体为总体 A的一个样本( Sample),样本中所含个体的数目 n称为样本容量( Sample size),抽取一个样本 的过程称为抽样( Sampling) 上页
二、样本 我们知道,研究总体离不开研究它的体.但 在许多实际问题中,不可能对所有个体逐一进行 研究,而只能从总体中抽取一部分个体进行观察 (或试验),根据对这部分个体的观察结果来推 断总体的分布情况. 一般地,如果从总体中按一定规则抽取n个 个体进行观察(或试验),则称这n个个体为总体 的一个样本(Sample),样本中所含个体的数目 n称为样本容量(Sample Size),抽取一个样本 的过程称为抽样(Sampling).
本书所涉及的抽样均指随机抽样,即,在具 体的抽样之前,哪些个体被抽取,不能预先确定 而应由观察(或试验)来定.如果用ⅹ表示样本 中的第论个个体的数量指标(=1,2,…,m),那么一个容 量为n的样本就可以表示为(X,X2…,Xn),这是一个 n维随机向量.如果用x表示x1的观察值(i=12…,m) 那么,(x,x2…x)便是样本(x1,X2M)的一个观察 值,称其为样本观察值或样本值,它是一组具体 的数据.今后,为了方便起见,记号x1,X2,Xn 牛有时也表示样本值,这可以从上下文的联系来区 分:如果在一次具体抽样之前,那么,(x,Xx2…X) 牛表示样本,它是一个m维随机向量 上页
本书所涉及的抽样均指随机抽样,即,在具 体的抽样之前,哪些个体被抽取,不能预先确定 而应由观察(或试验)来定.如果用 表示样本 中的第i个个体的数量指标 ,那么一个容 量为n的样本就可以表示为 ,这是一个 n维随机向量.如果用 表示 的观察值 ,那么, 便是样本 的一个观察 值,称其为样本观察值或样本值,它是一组具体 的数据.今后,为了方便起见,记号 有时也表示样本值,这可以从上下文的联系来区 分:如果在一次具体抽样之前,那么, 表示样本,它是一个n维随机向量 Xi (i = 1, 2, ,n) ( , , , ) X1 X2 Xn i x i x (i = 1, 2, ,n) ( , , , ) 1 2 n x x x ( , , , ) X1 X2 Xn ( , , , ) X1 X2 Xn ( , , , ) X1 X2 Xn
王(这种情形多出现在理论研究或推导中) 如果在一次具体抽样之后,则 表 2 示样本值,它是一个具体的数值向量(在 实际应用中就是这种情形) 要想由样本推断总体,就应当使样本 庄既继反映出总练的锋点n便于数学 9 性: 王与分群一)的各分 压2独文性,即,样本(…的各分量 上页
(这种情形多出现在理论研究或推导中); 如果在一次具体抽样之后,则 表 示样本值,它是一个具体的数值向量(在 实际应用中就是这种情形). 要想由样本推断总体,就应当使样本 既能够反映出总体的特点,又便于数学上 的处理.为此,要求样本具有以下两个特 性: (1)同分布性,即,样本 的各分 量与总体X有相同的分布; (2)独立性,即,样本 的各分量 相互独立. ( , , , ) X1 X2 Xn ( , , , ) X1 X2 Xn ( , , , ) X1 X2 Xn
我们把满足以上两个特性的样本称为简单随 机样本,把获得简单随机样本X1x2…,M)的过程, ±称为简单随机抽样由于简单随机样本实际上是由 组独立同分布的随机变量构成的,因此,简单 随机抽样就是独立地、重复地对总体X做抽样试 验就具体的方法而言,有放回抽样与不放回抽样 之分.对于有限总体(即总体中个体的数量有限) 我们通常采用放回抽样,这样随机抽取的样本便 是一个简单随机样本;对于无限总体(即总体中 牛个体的数量无限),放回抽样与不放回抽样几乎 没什么差别,因此通常采用不放回抽样在实 牛用上,即使对有限总体,只要抽取的 王页下
我们把满足以上两个特性的样本称为简单随 机样本,把获得简单随机样本 的过程, 称为简单随机抽样. 由于简单随机样本实际上是由 一组独立同分布的随机变量构成的,因此,简单 随机抽样就是独立地、重复地对总体X做抽样试 验. 就具体的方法而言,有放回抽样与不放回抽样 之分. 对于有限总体(即总体中个体的数量有限), 我们通常采用放回抽样,这样随机抽取的样本便 是一个简单随机样本;对于无限总体(即总体中 个体的数量无限),放回抽样与不放回抽样几乎 没什么差别,因此通常采用不放回抽样. 在实 用上,即使对有限总体 ,只要抽取的 ( , , , ) X1 X2 Xn
的个体数目n与总体中个体的总数目N之比 很小(通常要小于0.1),仍可用不放回抽 样,这样得到的样本可近似地看成一个简 单随机样本 今后,如不特别申明,我们所说的样本均 指简单随机样本 午由于样本(x1x2“x)的各分量独立且每 个分量的分布都与总体X的分布相同,所以, 王对密度函数溶练续理除体X而言,样 f(x,x2…,x,)=f(x,) (6-1) 上页
的个体数目n与总体中个体的总数目N之比 很小(通常要小于0.1),仍可用不放回抽 样,这样得到的样本可近似地看成一个简 单随机样本. 今后,如不特别申明,我们所说的样本均 指简单随机样本. 由于样本 的各分量独立且每 个分量的分布都与总体X的分布相同,所以, 对密度函数 为的连续型总体X而言,样 本 的联合密度函数 . (6-1) N n ( , , , ) X1 X2 Xn f (x) ( , , , ) X1 X2 Xn = = n i n i f x x x f x 1 1 2 ( , ,, ) ( )
王 而当总体X是离散型的且其概率函数{X=x=p(x) (=4)时,样本x…)的联合概率函 王数(或分布为) P(X=x,X2=x2…,Mn=x}=∏PX=x}=∏以(x)(6-2) l=1 上不论是联合密度函数,还是联合概率函数, 它们都是样本信息最全面的概括,非常适 合在某些场合(如第七章的参数估计)中 牛使用,但这种概括有时也不便或也没必要 使用,这时就需要引入能反映样本信息某 王个侧面的专门特征刻画 上页
而当总体X是离散型的且其概率函数 ( )时,样本 的联合概率函 数(或分布为). (6-2) 不论是联合密度函数,还是联合概率函数, 它们都是样本信息最全面的概括,非常适 合在某些场合(如第七章的参数估计)中 使用.但这种概括有时也不便或也没必要 使用,这时就需要引入能反映样本信息某 个侧面的专门特征刻画. P{X = x} = p(x) x = a1 ,a2 , ( , , , ) X1 X2 Xn { , , , } 1 1 2 2 n n P X = x X = x X = x = = = = = n i i n i i i P X x p x 1 1 { } ( )
王三、统计量与样本数字特征 1.统计量 完全由样本决定的量就称为统计量 ( Statisti),它只依赖于样本,而不依赖 王何未知参数,统让量过看作是对屠本 息的一种“提炼”和“集中”.比如对正态 总体a2) (1,X2…, X 中抽取的样本 来说,每个 王都含有的信息,而统计量就是对这种 牛信息的一个集中,在做统计推断时,我们 上页 下页返回
三、统计量与样本数字特征 1.统计量 完全由样本决定的量就称为统计量 (Statistic),它只依赖于样本,而不依赖 任何未知参数.统计量可以看作是对样本 的一种“加工”,是对样本中所含有用信 息的一种“提炼”和“集中”. 比如对正态 总体 中抽取的样本 来说,每个 都含有 的信息,而统计量 就是对这种 信息的一个集中,在做统计推断时,我们 ( , ) 2 N ( , , , ) X1 X2 Xn Xi X