第七章假设检验 我们在第一章就已经知道,推论统计有两个基本 内容:①假设检验;②参数估计。有了概率和概率分 布的知识,接下来我们要逐步掌握统计检验的一般步 骤。既然按照数学规则得到的概率都不能用经验方法 准确求得,于是,理论概率和经验得到的频率之间肯 定存在某种差别,这就引出了实践检验理论的问题。 随机变量的取值状态不同,其概率分布的形式也就不 同。本章我们不仅要引出二项分布和正态分布这两个 著名的概率分布,并且要将它们与抽样调查联系起 来,以领会统计检验,并逐步拓宽其应用面
第七章 假设检验 我们在第一章就已经知道,推论统计有两个基本 内容:①假设检验;②参数估计。有了概率和概率分 布的知识,接下来我们要逐步掌握统计检验的一般步 骤。既然按照数学规则得到的概率都不能用经验方法 准确求得,于是,理论概率和经验得到的频率之间肯 定存在某种差别,这就引出了实践检验理论的问题。 随机变量的取值状态不同,其概率分布的形式也就不 同。本章我们不仅要引出二项分布和正态分布这两个 著名的概率分布,并且要将它们与抽样调查联系起 来,以领会统计检验,并逐步拓宽其应用面
第一节二项分布 二项分布是从著名的贝努里试验中推导而来。所谓 贝努里试验,是指只有两种可能结果的随机试验。在实际 问题中,有许多随机现象只包含两个结果,如男与女,是 与非,生与死,同意与不同意,赞成与反对等等。通常 我们把其中比较关注那个结果称为“成功”,另一个结果 称为“失败”。每当情况如同贝努里试验,是在相同的条 件 下重复n次,考虑的是“成功”的概率,且各次试验相互 独 立,就可利用与二项分布有关的统计检验。虽然许多分布 较之二项分布更实用,但二项分布简单明了,况且其他概 率分布的使用和计算逻辑与之相同。所以要理解统计检验 以及它所涉及的许多新概念,人们几乎都乐意从二项爱布
第一节 二项分布 二项分布是从著名的贝努里试验中推导而来。所谓 贝努里试验,是指只有两种可能结果的随机试验。在实际 问题中,有许多随机现象只包含两个结果,如男与女,是 与非,生与死,同意与不同意,赞成与反对等等。通常, 我们把其中比较关注那个结果称为“成功”,另一个结果 则 称为“失败”。每当情况如同贝努里试验,是在相同的条 件 下重复n次,考虑的是“成功”的概率,且各次试验相互 独 立,就可利用与二项分布有关的统计检验。虽然许多分布 较之二项分布更实用,但二项分布简单明了,况且其他概 率分布的使用和计算逻辑与之相同。所以要理解统计检验 以及它所涉及的许多新概念,人们几乎都乐意从二项分布 的讨论入手
1.二项分布的数学形式 从掷硬币的试验入手。假定二项试验由重复抛掷m次 硬币组成,已知硬币面朝上(成功)的概率是p,面朝下(失 败)的概率是q(显然有q=1p。这样,对试验结果而 成功的次数(即硬币面朝上的次数)是一个离散型 随机变量,它的可能取值是0,1,2,3,……,n。而对X的 个具体取值x而言,根据乘法规则,我们立刻可以就试 验结果计算出一种特定排列方式(先x次面朝上,而后nx 次面朝下)实现的概率,即 Ppp…pqqq.q=pq
1. 二项分布的数学形式 从掷硬币的试验入手。假定二项试验由重复抛掷n次 硬币组成,已知硬币面朝上(成功)的概率是p,面朝下(失 败)的概率是q (显然有 q=1―p)。这样,对试验结果而 言,成功的次数(即硬币面朝上的次数)X是一个离散型 随机变量,它的可能取值是0,1,2,3,…,n。而对X的 一个具体取值x而言,根据乘法规则,我们立刻可以就试 验结果计算出一种特定排列方式(先x次面朝上,而后n―x 次面朝下)实现的概率,即 ppp…pqqq…q=p xq n-x
由于正确解决概率问题,光考虑乘法规则是 不够的,还要考虑加法规则,于是就x次成功和 (nx)次失败这个宏观结果而言所包含的所有 排列的方式数,用符号表示 ! 1-X 这样,我们就得到了二项试验中随机变量X的 概率分布,即 P(X=x)=Cap q
由于正确解决概率问题,光考虑乘法规则是 不够的,还要考虑加法规则,于是就x次成功和 (n―x)次失败这个宏观结果而言所包含的所有 排列的方式数,用符号表示 这样,我们就得到了二项试验中随机变量X的 概率分布,即
譬如,二项试验是将 硬币面朝概率PX 枚硬币重复做8次抛掷,假 上数x 设这枚硬币是无偏的,即 q=0.5,那么恰好得到 1/256=.004 5次面朝上的概率是 8/256=031 8/256=109 P(5)=Cpq 56/256=219 70/256=274 8! 56/256=219 53!2 /256=.109 8/256=.031 ≈0.219 1/256=.004 同理,我们也可以求出 1.000 这个二项试验中硬币刚好为 0,1,2,…,8次面朝上的 各种宏观结果的概率,全部 写出来就是右表
譬如,二项试验是将一 枚硬币重复做8次抛掷,假 设这枚硬币是无偏的,即 p=q=0.5,那么恰好得到 5次面朝上的概率是 硬币面朝 上数x 概率P(X=x) 0 1 2 3 4 5 6 7 8 1/256= .004 8/256= .031 28/256= .109 56/256= .219 70/256= .274 56/256= .219 28/256= .109 8/256= .031 1/256= .004 同理,我们也可以求出 合 计 1.000 这个二项试验中硬币刚好为 0,1,2,…,8次面朝上的 各种宏观结果的概率,全部 写出来就是右表
2.二项分布讨论 x012n合计 P(X) AP9 Cpg1CnP2…Cnn0 P=1 0.2 =0 ①二项分布为离散 P=0.5 型随机变量的分布。每 当试验做的是在相同的 条件下m次重复的伯努 利试验时,随机变量X 0. 共有m+1个取值。二项 分布可以用分布律(见上 表和折线图(见右图)来 表示 ②当P=0.5时二项分 68101214161820x 布的图形是对称的。 图7.1二项分布图
2. 二项分布讨论 X 0 1 2 … n 合计 P(X) … ① 二项分布为离散 型随机变量的分布。每 当试验做的是在相同的 条件下n次重复的伯努 利试验时,随机变量X 共有n+1个取值。二项 分布可以用分布律(见上 表)和折线图(见右图)来 表示。 ②当P=0.5时二项分 布的图形是对称的
BE()=unp, D(X=0=npq ④二项分布受p和n变化的影响,只要确定了p 和n,成功次数ⅹ的分布也随之确定。因此,二项分 布还可简写作B(x;n,)。 ⑤二项分布的概率值除了根据公式直接进行计算 外,还可查表求得。二项分布表的编制方法有两种: 种依据概率分布律P(x)编制(见附表2);另一种依 据分布函数F(x)编制(见附表3)。其中 F(x)=P(X2x)=∑ B(X n,p
③ E(X)=μ=np, D(X)= σ 2= npq ④ 二项分布受p 和 n 变化的影响,只要确定了p 和 n,成功次数 X 的分布也随之确定。因此,二项分 布还可简写作B(x; n,p)。 ⑤二项分布的概率值除了根据公式直接进行计算 外,还可查表求得。二项分布表的编制方法有两种: 一种依据概率分布律P(x) 编制(见附表2);另一种依 据分布函数F(x) 编制(见附表3)。 其中
[例某特定社区人口的0%是少数民族,现随机 抽取6人,问其中恰好2人是少数民族的概率是多少? [解]解法一:根据(7.3)式直接计算 6! 9 P(X=2)=Cpq =0.0984 2!4!10八(10 解法二:根据附表2中纵列n=6和横行p=0.,所 对应x值,可直接查得B(x;6,0.1)的概率值 B(2;6,0.1)=0.0984 解法三:根据附表3求得 B(2;6,0.1)=F(2)-F(3) 0.1143-0.0159=0.0984
◼ [例] 某特定社区人口的10%是少数民族,现随机 抽取6人,问其中恰好2人是少数民族的概率是多少? [解] 解法一:根据(7.3)式直接计算 解法二:根据附表2中纵列n=6和横行p=0.1所 对应x值,可直接查得B(x;6,0.1)的概率值 B (2;6,0.1)=0.0984 解法三:根据附表3求得 B (2;6,0.1)=F(2) ―F(3 ) = 0.1143―0.0159=0.0984
第二节统计检验的基本步骤 项分布是用数学或演绎推理的方法求得的一种理论分布。认识到 概率分布是先验的理论分布这一点很重要,因为我们不禁要问,既然试 验或抽样调査的结果仅与随机变量可能取值中的一个相联系,那么实际 试验或样本调查对结果的概率分布及前提假设有没有一个检验的问题? 具体来讲,对于一枚硬币被重复抛掷8次的二项试验,经验告诉我们, 共有9种可能的结果,而且实现这些结果的机会是大不相同的。研究者实 际上从来不用经验的方法求得概率分布,因为通常我们只对一项试验进 行一次或几次,抽取样本也是一个或至多不过几个。既然二项分布是按 照数学规则得到的,那么对这9种结果的可能性我们应该作出何种评价呢? 如果实际试验(或抽样)得到的结果偏巧就是先验概率预示的最不可能 出现的结果,那么我们是认定纯属巧合,还是开始对用数学或演绎推理 方法求得的概率以及理想试验的种种前提假设产生怀疑?更准确地说,在 枚硬币被重复抛掷8次的这个二项试验中,究竞出现什么结果时,我们 应该对二项分布及其前提假设产生怀疑呢?是不是只要不是得到4次成功4 次失败这个最大可能性结果就开始怀疑,还是仅当出现8次成功或一次也 不成功这两个极端情况时才产生怀疑呢?这就是统计检验的核心问题
第二节 统计检验的基本步骤 二项分布是用数学或演绎推理的方法求得的一种理论分布。认识到 概率分布是先验的理论分布这一点很重要,因为我们不禁要问,既然试 验或抽样调查的结果仅与随机变量可能取值中的一个相联系,那么实际 试验或样本调查对结果的概率分布及前提假设有没有一个检验的问题? 具体来讲,对于一枚硬币被重复抛掷8次的二项试验,经验告诉我们,一 共有9种可能的结果,而且实现这些结果的机会是大不相同的。研究者实 际上从来不用经验的方法求得概率分布,因为通常我们只对一项试验进 行一次或几次,抽取样本也是一个或至多不过几个。既然二项分布是按 照数学规则得到的,那么对这9种结果的可能性我们应该作出何种评价呢? 如果实际试验(或抽样)得到的结果偏巧就是先验概率预示的最不可能 出现的结果,那么我们是认定纯属巧合,还是开始对用数学或演绎推理 方法求得的概率以及理想试验的种种前提假设产生怀疑?更准确地说,在 一枚硬币被重复抛掷8次的这个二项试验中,究竟出现什么结果时,我们 应该对二项分布及其前提假设产生怀疑呢?是不是只要不是得到4次成功4 次失败这个最大可能性结果就开始怀疑,还是仅当出现8次成功或一次也 不成功这两个极端情况时才产生怀疑呢?这就是统计检验的核心问题
统计检验是指先建立一个关于总体情况的假设 继而抽取一个随机样本,然后以样本的统计量或者统 计性质来检定假设。 大数定理表明:就大量观察 而言:事件的发生具有一定 统计检验的依据是 的规律性。 小概率原理:一是认为 根据概率的大小,人们处理 的态度和方式很不一样。 小概率事件在一次观察 在日常生活中人们往往习L中是极少出现的;二是 惯于把概率很小的事件,当 作一次观察中是极不可能看 如果在一次观察中出现 到的事件。例如,人们出 了小概率事件,那么应 但却很少人因此而不敢山门该否定原有事件具有小 原因是:小概率事件极不可概率的说法或者假设 能发生
◼ 大数定理表明:就大量观察 而言,事件的发生具有一定 的规律性。 ◼ 根据概率的大小,人们处理 的态度和方式很不一样。 ◼ 在日常生活中,人们往往习 惯于把概率很小的事件,当 作一次观察中是极不可能看 到的事件。例如,人们出门 做事就有可能遇到不测事故, 但却很少人因此而不敢出门。 原因是:小概率事件极不可 能发生。 统计检验是指先建立一个关于总体情况的假设, 继而抽取一个随机样本,然后以样本的统计量或者统 计性质来检定假设。 统计检验的依据是 小概率原理:一是认为 小概率事件在一次观察 中是极少出现的;二是 如果在一次观察中出现 了小概率事件,那么应 该否定原有事件具有小 概率的说法或者假设