第六章概率与概率分布 本章是推断统计的基础 主要内容包括:基础概率,概率的数学性质,概率分布、期望值与变异数 推断统计研究如何依据样本资料对总体性质作出推断,这是以概率论为基础 第一节基础概率 概率论起源于17世纪,当时在人口统计、人寿保险等工作中,要整理和硏 究大量的随机数据资料,这就需要一种专门研究大量随机现象的规律性的数学 参赌者就想:如果同时掷两颗骰子,则点数之和为9和点数之和为10 哪种情况出现的可能性较大? 例如17世纪中叶,贵族德·梅尔发现:将一枚骰子连掷四次,出现一个6 点的机会比较多,而同时将两枚掷24次,出现一次双6的机会却很少。 概率论的创始人是法国的帕斯卡(1623-1662)和费尔马(1601-1665),他们 在以通信的方式讨论赌博的机率问题时,发表了《骰子赌博理论》一书。棣莫弗 (1667-1754)发现了正态方程式。同一时期瑞士的伯努利(16541705提出了二 项分布理论。1814年,法国的拉普拉斯(1749—1827发表了《概率分析论》,该 书奠定了古典概率理论的基础,并将概率理论应用于自然和社会的研究。此后, 法国的泊松(1781一1840)提出了泊松分布,德国的高斯(1777-1855提出了最小 平方法。 随机现象和随机事件 概率是与随机现象相联系的一个概念。所谓随杋现象,是指事先不能精确预 言其结果的现象,如即将出生的婴儿是男还是女?一枚硬币落地后其正面是朝上 还是朝下?等等。所有这些现象都有一个共同的特点,那就是在给定的条件下, 观察所得的结果不止一个。随机现象具有非确定性,但内中也有一定的规律性 例如,事先我们虽不能准确预言一个婴儿出生后的性别,但大量观察,我们会发 现妇女生男生女的可能性几乎一样大,都是05,这就是概率
第六章 概率与概率分布 本章是推断统计的基础。 主要内容包括:基础概率,概率的数学性质,概率分布、期望值与变异数 推断统计研究如何依据样本资料对总体性质作出推断,这是以概率论为基础 的。 第一节 基础概率 概率论起源于 17 世纪,当时在人口统计、人寿保险等工作中,要整理和研 究大量的随机数据资料,这就需要一种专门研究大量随机现象的规律性的数学。 参赌者就想:如果同时掷两颗骰子 ,则点数之和为 9 和点数之和为 10 , 哪种情况出现的可能性较大? 例如 17 世纪中叶,贵族德·梅尔发现:将一枚骰子连掷四次,出现一个 6 点的机会比较多,而同时将两枚掷 24 次,出现一次双 6 的机会却很少。 概率论的创始人是法国的帕斯卡(1623—1662)和费尔马(1601—1665),他们 在以通信的方式讨论赌博的机率问题时,发表了《骰子赌博理论》一书。棣莫弗 (1667—1754)发现了正态方程式。同一时期瑞士的伯努利(1654 一 1705)提出了二 项分布理论。1814 年,法国的拉普拉斯(1749—1827)发表了《概率分析论》,该 书奠定了古典概率理论的基础,并将概率理论应用于自然和社会的研究。此后, 法国的泊松(1781—1840)提出了泊松分布,德国的高斯(1777—1855)提出了最小 平方法。 1、随机现象和随机事件 概率是与随机现象相联系的一个概念。所谓随机现象,是指事先不能精确预 言其结果的现象,如即将出生的婴儿是男还是女?一枚硬币落地后其正面是朝上 还是朝下?等等。所有这些现象都有一个共同的特点,那就是在给定的条件下, 观察所得的结果不止一个。随机现象具有非确定性,但内中也有一定的规律性。 例如,事先我们虽不能准确预言一个婴儿出生后的性别,但大量观察,我们会发 现妇女生男生女的可能性几乎一样大,都是 0.5,这就是概率
随机现象具有一定条件呈现多种可能结果的特性。 人们把随机现象的结果以及这些结果的集合体称作随机事件。 在统计学中,我们把类似掷一枚硬币的行为(或对某一随机现象进行观察) 称之为随机试验。随机试验必须符合以下三个条件 ①它可以在相同条件下重复进行 ②试验的所有结果事先已知; ③每次试验只出现这些可能结果中的一个,但不能预先断定出现哪个结果 l样本点 随机试验的每一个可能的结果,称为基本事件(或称样本点) 2样本空间 所有样本点的全体称作样本空间( Sample space,记作9 [例]掷一颗骰子,试列出它的基本事件和样本空间。 随机事件: 简单事件:仅含样本空间中一个样本点的事件。 复合事件:含样本空间中一个样本点以上的的事件。 极端的随机事件: 不可能事件:从样本空间来看,不含任何基本事件,记作Φ。 必然事件:从样本空间来看,该事件事件是由其全部基本事件 所组成,记作S 1O≤P(2)≤1 [例]对掷一颗骰子的试验,我们研究如下 事件:①A为“点数是3”;②B为“出现奇数点”;③C为“出现点数不超过6 ④D为“点数是7”。 [解]因为9={1,2,3,4,5,6},所以 ①A={3},为简单事件 ②B={1,3,5},为复合事件 ③C={1,2,3,4,5,6},为必然事件;
随机现象具有一定条件呈现多种可能结果的特性。 人们把随机现象的结果以及这些结果的集合体称作随机事件。 在统计学中,我们把类似掷一枚硬币的行为(或对某一随机现象进行观察) 称之为随机试验。随机试验必须符合以下三个条件: ①它可以在相同条件下重复进行; ②试验的所有结果事先已知; ③每次试验只出现这些可能结果中的一个,但不能预先断定出现哪个结果。 1.样本点 随机试验的每一个可能的结果,称为基本事件(或称样本点) 2.样本空间 所有样本点的全体称作样本空间(Sample space),记作Ω [例] 掷一颗骰子,试列出它的基本事件和样本空间。 随机事件: 简单事件:仅含样本空间中一个样本点的事件。 复合事件:含样本空间中一个样本点以上的的事件。 极端的随机事件: 不可能事件:从样本空间来看 ,不含任何基本事件,记作Φ 。 必然事件:从样本空间来看 ,该事件事件是由其全部基本事件 所组成,记作 S 。 [例 ] 对掷一颗骰子的试验,我们研究如下 事件:①A 为“点数是 3”;②B 为“出现奇数点”;③C 为“出现点数不超过 6”; ④D 为“点数是 7”。 [解] 因为Ω={1,2,3,4,5,6},所以 ①A={3} ,为简单事件; ②B={1,3,5},为复合事件; ③C={1,2,3,4,5,6},为必然事件; 0 P(E) 1
④D={7},为不可能事件。 2.事件之间的关系 (1)事件和(q A+B或A∪B B至少有一个事件发生所 构成的事件C称为 事件C称为A与B8网B或A∩B与事件B同时发生所构成的 (2)事件积(Asw 4<B或B→∠ (3)事 B发生,则称为B包 含A记作 AcB同时A→B 如果 则A=B (4)互斥事件 4∩B D称B和A是互斥事件, 或互不相容事件,记作 (5)对立事件 次试验中必有其 发生,称人与B为对B=A或A= (6)相互独立事件一一事件A的发生与事件B是否发生毫无关系,称A与 B为相互独立事A=A/B或B=B/A
④D={7},为不可能事件。 2. 事件之间的关系 (1)事件和(Or conjunction)——事件 A 与事件 B 至少有一个事件发生所 构成的事件 C 称为 A 与 B 的事件和,记作 (2)事件积(As-well-as conjunction)——事件 A 与事件 B 同时发生所构成的 事件 C 称为 A 与 B 的事件积,记作 (3)事件的包含与相等——事件 A 发生必然导致事件 B 发生,则称为 B 包 含 A 记作 如果 则 A=B (4)互斥事件——事件 A 和事件 B 不能同时发生,则称 B 和 A 是互斥事件, 或互不相容事件,记作 (5)对立事件——事件 A 与事件 B 是互斥事件,且在一次试验中必有其一 发生,称 A 与 B 为对立事件(逆事件),记作 (6)相互独立事件——事件 A 的发生与事件 B 是否发生毫无关系,称 A 与 B 为相互独立事件,记作 A+ B或A B AB或A B A B或B A A B同时A B A B = B = A或A = B A = A/ B或B = B / A
两随机事件之间的 1. ACB 2. AUB 3.A∩B 4.A∩B= 图6.1两随机事件之间的关系 3.先验概率 在统计学中,有两种常见的确定概率的方法:古典法和频率法。 用古典法求出的概率 由普拉斯1814年提出。以想象总体为对象,利用模型本身所具有的对称性 来事先求得概率,故被称为先验概率。 条件: (1)在一样本空间中,各样本点出现的机会均等 (2)该样本空间只右右阻(n个样木点。 这样对于含有m个样本()=既率为 用古典法求算概率,在应用上有两个缺点:①它只适用于有限样本点的情 况;②它假设机会均等,但这些条件实际上往往不能得到满足
两随机事件之间的关系: 3. 先验概率 在统计学中,有两种常见的确定概率的方法:古典法和频率法。 用古典法求出的概率 由普拉斯 1814 年提出。以想象总体为对象,利用模型本身所具有的对称性 来事先求得概率,故被称为先验概率。 条件: (1)在一样本空间中,各样本点出现的机会均等; (2)该样本空间只有有限(n)个样本点。 这样对于含有 m 个样本点的事件 A,其出现的概率为: 用古典法求算概率,在应用上有两个缺点:①它只适用于有限样本点的情 况;②它假设机会均等,但这些条件实际上往往不能得到满足。 n m P(A) =
[例]掷两枚均匀的硬币,①求“两枚都朝上”的概率;②求“一枚朝 上,一枚朝下”的概率。 4、经验概率 求算概率的另一途径是运用频率法。设想有一个与某试验相联系的事件 把这个试验一次又一次地做下去,每次都记录事件A是否发生了。假如做了n 次试验,而记录到()一“成功m次),则频数与试验次数 的比值,称作次试验屮于 显然,频玄目左双重性质随机性和扭往 当试验或P(A)=limf(A) 这个极限值就是用频 H→0 率法所定义的概 频率稳定到概率这个事实,给了“机会大小”即概率一个浅显而说得通的 解释,这在统计学上具有很重要的意义。坚持这种观点的统计学派也就被称为频 率学派 比如: 法国统计学家蒲丰( Buffon)把铜板抛了4040次,正面的次数是2048,比 例是0.5069。 1900年,英国统计学家皮尔逊把硬币抛了24000次,正面的次数是12012, 比例是0.5005 南非数学家柯屈瑞在监狱时,把硬币抛了10000次,正面的次数是5067, 比例是0.5067 再如: 保险公司会利用概率进行人寿保险经营,比如研究表明20-24岁的男性中
[例] 掷两枚均匀的硬币, ①求“两枚都朝上”的概率; ②求“一枚朝 上,一枚朝下”的概率。 4、经验概率 求算概率的另一途径是运用频率法。设想有一个与某试验相联系的事件 A, 把这个试验一次又一次地做下去,每次都记录事件 A 是否发生了。假如做了 n 次试验,而记录到事件 A 发生了 m 次(即成功 m 次),则频数与试验次数 的比值,称作次试验中事件 A 发生的频率 显然,频率具有双重性质:随机性和规律性. 当试验或观察次数趋近于无穷时相应频率趋于稳定,这个极限值就是用频 率法所定义的概率,即 频率稳定到概率这个事实,给了“机会大小”即概率一个浅显而说得通的 解释,这在统计学上具有很重要的意义。坚持这种观点的统计学派也就被称为频 率学派。 比如: 法国统计学家蒲丰(Buffon)把铜板抛了 4040 次,正面的次数是 2048,比 例是 0.5069 。 1900 年,英国统计学家皮尔逊把硬币抛了 24000 次,正面的次数是 12012, 比例是 0.5005 南非数学家柯屈瑞在监狱时,把硬币抛了 10000 次,正面的次数是 5067, 比例是 0.5067 。 再如: 保险公司会利用概率进行人寿保险经营,比如研究表明 20-24 岁的男性中 n m f (A) = n m P A f A n = = → ( ) lim ( )
明年死亡的概率是00015,同龄的女性是00005,保险公司对男性的保费就多收 一些。 第二节概率的数学性质 P(A4或B)=P(A)+P(B) 1非负性 2加法树P(4或B)=P(4)+P(B)=P(A且B 如果事件A和事件B互斥,那么 如果A秆 AnB 也表示为如下形式 图6.3概率(两事件相加)的几何图形表示法 例从一副普通扑克牌中抽一张牌,求抽到一张红桃或者方块的概率。 例]在一副52张扑克牌中,求单独抽取一次抽到一张红桃或爱司的概率 例]根据上海市职业代际流动的统计,向下流动的概率是0.07,静止不动 的概率是0.6,求向上流动的概率是多少? [例]为了研究父代文化程度对子代文化程度的影响,某大学统计出学生中 父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而双方都 具有文化程度的占有10%,问从学生中任抽一名,父代至少有一名具有大学文
明年死亡的概率是 0.0015,同龄的女性是 0.0005,保险公司对男性的保费就多收 一些。 第二节 概率的数学性质 1.非负性 2.加法规则 如果事件 A 和事件 B 互斥,那么 如果 A 和 B 是任何事件(不一定互斥),加法规则更普通地表示为如下形式 [例]从一副普通扑克牌中抽一张牌,求抽到一张红桃或者方块的概率。 [例] 在一副 52 张扑克牌中,求单独抽取一次抽到一张红桃或爱司的概率。 [例] 根据上海市职业代际流动的统计,向下流动的概率是 0.07,静止不动 的概率是 0.6,求向上流动的概率是多少? [例] 为了研究父代文化程度对子代文化程度的影响,某大学统计出学生中 父亲具有大学文化程度的占 30%,母亲具有大学文化程度的占 20%,而双方都 具有文化程度的占有 10%,问从学生中任抽一名,父代至少有一名具有大学文 P(A或B) = P(A) + P(B) P(A或B) = P(A) + P(B) − P(A且B)
化程度的概率是多少? 加P(A且B)=P(A)P(B/A)=P(B)P(A/B 有 P(A或BPA战KP团AP(B)PC)…+PPA/的 3乘法规则 式中符号 和 代表条件概率 应理解为, “在B已 PCA/B)=P(A) EP(B/A)=P(B A发生 分白 概率可能有别于B没有发生时A发生的概率。 理解统计独 很重要。现在用条件 概率来加以表达, (A且B)=P(A)P(B 若A和B在统计上相互独立(无关),这时乘法规则可以简化为 [例1]假定有下列3000个社区的数据,如果随机地从这个总体中抽取一个 社区,得到一个中等的而且犯罪率低的社区的概率是多少? 例2]假定数据变动如下,随机地从这个总体中抽取一个社区,得到一个中 等的而且犯罪率低的社区的概率又是多少? [例3]根据统计结果,男婴出生的概率是22/43,女婴出生的概率是21/43 某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?都生女婴的概率是多 少?其中一男一女的概率是多少? [例4]某居民楼共20户,其中核心家庭为2户,问访问两户都是核心家庭 的概率是多少?问访问第二户才是核心家庭的概率是多少?
化程度的概率是多少? 加法规则可推广到对两个以上的事件,若事件 A,B,C…K 都互斥,那么 有 P (A 或 B 或 C…或 K)=P(A)+P(B)+P(C)… +P(K) 3.乘法规则 式中符号 和 代表条件概率。 应理解为, “在 B 已经发生条件下 A 发生的概率”。条件概率的意思是, A 发生的概率可能与 B 是否发生有关系。换言之,B 已经发生时 A 发生的 概率可能有别于 B 没有发生时 A 发生的概率。 理解统计独立的概念,对于灵活运用概率的乘法规则很重要。现在用条件 概率来加以表达,统计独立是指 若 A 和 B 在统计上相互独立(无关) ,这时乘法规则可以简化为 [例 1]假定有下列 3000 个社区的数据,如果随机地从这个总体中抽取一个 社区,得到一个中等的而且犯罪率低的社区的概率是多少? 例 2]假定数据变动如下,随机地从这个总体中抽取一个社区,得到一个中 等的而且犯罪率低的社区的概率又是多少? [例 3]根据统计结果,男婴出生的概率是 22/43,女婴出生的概率是 21/43, 某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?都生女婴的概率是多 少?其中一男一女的概率是多少? [例 4] 某居民楼共 20 户,其中核心家庭为 2 户,问访问两户都是核心家庭 的概率是多少?问访问第二户才是核心家庭的概率是多少? P(A且B) = P(A)P(B / A) = P(B)P(A/ B) P(A/ B) P(B / A) P(A/ B) P(A/ B) = P(A)或P(B / A) = P(B) P(A且B) = P(A)P(B)
在抽样方法中还经常涉及到回置抽样和不回置抽样。如前所述,所谓回置 抽样,就是抽取的单位登记后又被放回总体中去,然后再进行下一次抽取。使用 回置抽样法,先后两次抽取是彼此独立的。因为每一次抽取后抽取到的单位都得 返还,总体保持不变,前一次的结果不可能影响到后一次。所谓不回置抽样,就 是不再把抽取到的单位退还总体。这样先后两次抽取就不再独立了,必须使用 条件概率的概念。 例1:用回置法从一幅普通扑克牌抽取两次,计算得到两张A的概率。 例2:用不回置法从一幅普通扑克牌抽取两次,计算得到两张A的概率。 例3:为了研究父代文化程度对子代文化程度的影响,某大学统计出学生中 父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而双方都 具有文化程度的占有10%,问从学生中任抽一名,父代至少有一名具有大学文 化程度的概率是多少? 在抽样方法中还经常涉及到回置抽样和不回置抽样。如前所述,所谓回置 抽样,就是抽取的单位登记后又被放回总体中去,然后再进行下一次抽取。使用 回置抽样法,先后西M 次抽取后抽取到的单位都得 4 4 返还,总体保持不 169后一次。所谓不回置抽样,就 是不再把抽取到的单位退还总体。这样先后两次抽取就不再独立了,必须使用条 件概率的概念。 用回置法从 1(从)-2 得到两张A的概率。 用不回置法从一幅普通扑克牌抽取两次,计算得到两张A的概率。 4、排列和样本点的计数 要正确解决概率问题,往往光考虑乘法规则还不够,还要同时考虑使用加法 规则。一般最简单的做法是:首先确定一种符合要求的排列方式并计算它们发生
在抽样方法中还经常涉及到回置抽样和不回置抽样。如前所述,所谓回置 抽样,就是抽取的单位登记后又被放回总体中去,然后再进行下一次抽取。使用 回置抽样法,先后两次抽取是彼此独立的。因为每一次抽取后抽取到的单位都得 返还,总体保持不变,前一次的结果不可能影响到后一次。所谓不回置抽样,就 是不再把抽取到的单位退还总体。这样先后两次抽取就不再独立了,必须使用 条件概率的概念。 例 1:用回置法从一幅普通扑克牌抽取两次,计算得到两张 A 的概率。 例 2:用不回置法从一幅普通扑克牌抽取两次,计算得到两张 A 的概率。 例 3:为了研究父代文化程度对子代文化程度的影响,某大学统计出学生中 父亲具有大学文化程度的占 30%,母亲具有大学文化程度的占 20%,而双方都 具有文化程度的占有 10%,问从学生中任抽一名,父代至少有一名具有大学文 化程度的概率是多少? 在抽样方法中还经常涉及到回置抽样和不回置抽样。如前所述,所谓回置 抽样,就是抽取的单位登记后又被放回总体中去,然后再进行下一次抽取。使用 回置抽样法,先后两次抽取是彼此独立的。因为每一次抽取后抽取到的单位都得 返还,总体保持不变,前一次的结果不可能影响到后一次。所谓不回置抽样,就 是不再把抽取到的单位退还总体。这样先后两次抽取就不再独立了,必须使用条 件概率的概念。 用回置法从一幅普通扑克牌抽取两次,计算得到两张 A 的概率。 用不回置法从一幅普通扑克牌抽取两次,计算得到两张 A 的概率。 4、排列和样本点的计数 要正确解决概率问题,往往光考虑乘法规则还不够,还要同时考虑使用加法 规则。一般最简单的做法是:首先确定一种符合要求的排列方式并计算它们发生 169 1 52 4 52 4 = = 221 1 52 3 52 4 = =
的概率,然后再考虑还有没有其他同样符合要求的排列方式。如果存在着其他实 现方式,并且都具有 简单地把排列方式数与以某一给定的排 列方式计算的概率相 使用了加法规则。 所有N个元素 方式数为N! N个元素中,若其中第一组中有r个不能区分的元素,第2组中有r2个不 能区分的元素,…,第k组中有rk个不能区分的元素,且各组彼此是可以区分 的,则总的排列数为 [例]从一幅洗得很好的扑克牌中做了3次抽取,假定使用回置法,求至少 得到1张A和一张K的概率是多少?(1/13)(1/13)(11/13) 解按照题意,要在不同样本空间中考(1/13)-(1/13)1张A和1张 K,另1张非A非K,用符号(AKO表示(其(/13)·(1/13)到1张A和2 张K,用符号(AKK)麦表示;抽到2张A和1张K,用符号(AAK)麦表示。因为在 不同样本空间中基本事件实现的概率不同,必须对它们加以区别 次序为AKO的样本点实现的概率是 次序为AKK的样本点实现的概率是 次序为AAK的样本点实现的概率是 13/+3 66+3+3 2197=0.033 (AAK)含有3!/2!=3种排列方式 (AKO)含有3!=6种排列方式 所以,在三次抽取中,至少得到1张A和1张K的概率是 [例]假如对1000个大学生进行歌曲欣赏调查,发现其中有500个学生喜 欢民族歌曲,400个学生喜欢流行歌曲,而这些学生中有100人属于既喜欢民族 歌曲又喜欢流行歌曲的,剩下来的学生两种歌曲都不喜欢。如果我们随机地从该 总体中抽取一个学生,并设事件A为该学生喜欢民族歌曲,事件B为该学生喜
的概率,然后再考虑还有没有其他同样符合要求的排列方式。如果存在着其他实 现方式,并且都具有相同的概率,就可以简单地把排列方式数与以某一给定的排 列方式计算的概率相乘。注意,后一步相当于使用了加法规则。 所有 N 个元素都不相同的情况下,排列方式数为 N! N 个元素中,若其中第一组中有 r1 个不能区分的元素,第 2 组中有 r2 个不 能区分的元素,…,第 k 组中有 rk 个不能区分的元素,且各组彼此是可以区分 的,则总的排列数为:: [例] 从一幅洗得很好的扑克牌中做了 3 次抽取,假定使用回置法,求至少 得到 1 张 A 和一张 K 的概率是多少? [解]按照题意,要在不同样本空间中考虑三种复合事件:抽到 1 张 A 和 1 张 K,另 l 张非 A 非 K,用符号(AKO)表示(其中“O”表示其他);抽到 1 张 A 和 2 张 K,用符号(AKK)表示;抽到 2 张 A 和 1 张 K,用符号(AAK)表示。因为在 不同样本空间中基本事件实现的概率不同,必须对它们加以区别。 次序为 AKO 的样本点实现的概率是 次序为 AKK 的样本点实现的概率是 次序为 AAK 的样本点实现的概率是 再考虑每个复合事件各含有多少种可能的排列方式 (AKK)含有 3!/2!=3 种排列方式 (AAK)含有 3!/2!=3 种排列方式 (AKO)含有 3!=6 种排列方式 所以,在三次抽取中,至少得到 1 张 A 和 1 张 K 的概率是 [例] 假如对 1000 个大学生进行歌曲欣赏调查,发现其中有 500 个学生喜 欢民族歌曲,400 个学生喜欢流行歌曲,而这些学生中有 100 人属于既喜欢民族 歌曲又喜欢流行歌曲的,剩下来的学生两种歌曲都不喜欢。如果我们随机地从该 总体中抽取一个学生,并设事件 A 为该学生喜欢民族歌曲,事件 B 为该学生喜 ! ! ! ! r1 r 2 rk N (1/13)(1/13)(11/13) ( ) ( ) 2 1/13 1/13 (1/13) (1/13) 2 0.033 2197 66 3 3 13 1 3 13 1 3 13 11 13 1 6 2 3 3 = + + = + +
欢流行歌曲。 ①用数字证明P(A且B)=P(AP(BA=P(BP(A/B) ②得到一个喜欢两种风格歌曲之一的学生的概率是多少? ③随机地选取一个由3个学生组成的样本,要求这三个学生全都有相同 的欣赏方式,得到这种样本的概率是多少? 5.运用概率方法进行统计推断的前提 (1)随机抽样 (2)样本容量相对于总体来说,是较小的 (3)总体中个体的组合具有被同等抽中的概率 (4)注意独立性问题 简单随机抽样要求每一个个体拥有相同的被选入样本的机会。 严格来讲,由于我们实际上总是做不回置抽样,因此独立性的假定,是难以 完全满足的。只有在样本非常大,可以忽略 个随机样本具有以下的性质:不仅要给每一个个体以相等的被抽中的机 会,而且要给每一种个体的组合以相等的被抽中的机会。 在要概括社区或其他空间上限定区域的单位的情况时,也必须注意到缺乏独 立性的问题。 第三节概率分布、期望值与变异数 随机事件及其概率回答的是随机现象某一局部结果,例如对给定的复合事件 求先验概率。而概率分布则要在满足完备性(穷举)和互不相容性(互斥)的前提下, 回答随机现象一共会出现多少种结果,以及每种结果所伴随的概率是多少。 应该指出,在统计中,概率分布是就随机现象呈现的宏观结果而言的。所谓 宏观结果,是指可以在宏观层次加以识别的而与特定排列次序无关的样本空间的 子集。 频率分布与概率分布的区别 经验分布:频率分布是经资料整理而来频率分布随样本不同而不同;频率分
欢流行歌曲。 ①用数字证明 P(A 且 B)=P(A)P(B/A)=P(B)P(A/B) ②得到一个喜欢两种风格歌曲之一的学生的概率是多少? ③随机地选取一个由 3 个学生组成的样本,要求这三个学生全都有相同 的欣赏方式,得到这种样本的概率是多少? 5. 运用概率方法进行统计推断的前提 (1) 随机抽样 (2) 样本容量相对于总体来说,是较小的 (3) 总体中个体的组合具有被同等抽中的概率 (4)注意独立性问题 简单随机抽样要求每一个个体拥有相同的被选入样本的机会。 严格来讲,由于我们实际上总是做不回置抽样,因此独立性的假定,是难以 完全满足的。 只有在样本非常大,可以忽略。 一个随机样本具有以下的性质:不仅要给每一个个体以相等的被抽中的机 会,而且要给每一种个体的组合以相等的被抽中的机会。 在要概括社区或其他空间上限定区域的单位的情况时,也必须注意到缺乏独 立性的问题。 第三节 概率分布、期望值与变异数 随机事件及其概率回答的是随机现象某一局部结果,例如对给定的复合事件 求先验概率。而概率分布则要在满足完备性(穷举)和互不相容性(互斥)的前提下, 回答随机现象一共会出现多少种结果,以及每种结果所伴随的概率是多少。 应该指出,在统计中,概率分布是就随机现象呈现的宏观结果而言的。所谓 宏观结果,是指可以在宏观层次加以识别的而与特定排列次序无关的样本空间的 子集。 频率分布与概率分布的区别: 经验分布:频率分布是经资料整理而来;频率分布随样本不同而不同;频率分