第三章统计推断 §3.1 统计学的基本概念。前面两章中我们介

正在加载图片...

第三章统计推断 §3.1统计学的基本概念。前面两章中我们介绍了概率论的基本内容,包括古典概型的一些计算方法以及研究随机现象的有力工具一一随机变量。从本章起,我们开始讨论统计学的核心内容,即如何从一些包含有随机误差,又并不完全的信息中得出科学的、尽可能正确的结论。在一般情况下,所谓信息就是从实验或调査中得到的数据,这些数据显然带有一些我们既无法控制、也无法避免的误差。换句话说,即使我们尽可能保持所有条件都不改变,当你把实验重做一遍时,所得到的结果总会或多或少有所不同,这就是随机误差的影响。至于信息的不完全性,这主要是因为在一般情况下我们不可能把所有感兴趣的东西都拿来进行测定。例如要研究中国人的体型或某种病的流行程度,我们不可能把全中国每个人都测量一番,或对每个人进行体检, 只能是按照某种事先确定好实验方案挑选一些人进行体检或测量。再比如希望对一批产品是否合格作出判断时,常常也不能对每个产品均做检验,只能是抽査少数产品。在这些情况下, 我们获得的信息显然是不够完整的。如何从这些不完整的信息出发,对我们感兴趣的事物整体作出尽可能正确的判断呢?这就是统计学要解决的主要问题。一般来说,我们获得的信息所包含的不确定性,主要来自以下几个方面:(1)测量过程引入的随机误差:(2)取样随机性所带来的变化,即由于只取少数样品测量,那么取这一批样品的测量结果与取另外一批当然会有差别:(3)我们所关心的性质确实发生了某种变化显然只有第三种改变才是我们所要检测的。统计学的任务就是在前两种干挠存在的情况下, 对第三种改变是否存在给出一个科学的结论。另外需要注意的一点是统计学是可能发生错误的。由于据以作出统计判断的信息是不完全的,有误差的,我们也就无法保证统计学结论是百分之一百地正确。这与它的科学性并不矛盾,我们所面对的就是这样一个并不完美的世界,我们对这个世界的认识也只能是一种相对正确的真理,我们只能在此基础上作出尽可能正确的结论。同时,统计学一般不仅给出结论,而且给出这一结论的可靠性,即它是正确的可能性有多大。这样,我们就可以对一旦犯错误所造成的损害进行某种控制。总之,对于需要从有误差的实验数据中得出结论的科学工作者来说,统计学是一种不可或缺的工具、统计推断的两种途径:假设检验与参数估计作出统计判断的主要工具就是假设检验。它的基本思路是这样的:首先,根据需要判断的目标建立一个统计假设,它的主要要求是一但我们对这一假设是否成立作出了结论,就应该能够对所要判断的目标作出明确的回答;其次,根据所建立的统计假设,利用统计学知识建立起一个理论分布,根据这一理论分布必须能计算出我们观察到的实验结果出现的可能性有多大;第三步,是算出实验结果出现的可能性后,把这可能性与人为规定的一个标准( 般取为0.05,称为显著性水平)进行比较,如果可能性大于这一标准,则认为统计假设很可能是对的,即接受统计假设:若可能性小于这一标准,说明在统计假设成立的条件下,观测到这一实验结果的可能性很小。一般来说,一个小概率事件在一次观测中是不应出现的,而现在它竟然出现了,一个合理的解释就是它实际上不是一个小概率事件,我们把它当作一个小概率事件是因为我们的统计假设不对,因此所算出来的它出现的概率也不对。在这种情况下,我们就应拒绝统计假设。这样,我们就根据实验结果对统计假设是否成立作出了判断, 从而也对我们要解决的目标作出了明确的回答。根据统计假设的类型,我们可以把假设检验进一步分为参数检验和非参数检验。统计的另一个重要功能就是作出参数估计。在实践中,我们常常希望对某些参数给出估计值,例如农作物的产量,产品的合格率或使用寿命,人群中某种疾病的发病率,等等。统计学也可根据抽样结果对这一类问题作出回答。答案一般有两种类型,一种是给出该参数可第三章统计推断 §3.1 统计学的基本概念。前面两章中我们介绍了概率论的基本内容，包括古典概型的一些计算方法以及研究随机现象的有力工具——随机变量。从本章起，我们开始讨论统计学的核心内容，即如何从一些包含有随机误差，又并不完全的信息中得出科学的、尽可能正确的结论。在一般情况下，所谓信息就是从实验或调查中得到的数据，这些数据显然带有一些我们既无法控制、也无法避免的误差。换句话说，即使我们尽可能保持所有条件都不改变，当你把实验重做一遍时，所得到的结果总会或多或少有所不同，这就是随机误差的影响。至于信息的不完全性，这主要是因为在一般情况下我们不可能把所有感兴趣的东西都拿来进行测定。例如要研究中国人的体型或某种病的流行程度，我们不可能把全中国每个人都测量一番，或对每个人进行体检，只能是按照某种事先确定好实验方案挑选一些人进行体检或测量。再比如希望对一批产品是否合格作出判断时，常常也不能对每个产品均做检验，只能是抽查少数产品。在这些情况下，我们获得的信息显然是不够完整的。如何从这些不完整的信息出发，对我们感兴趣的事物整体作出尽可能正确的判断呢？这就是统计学要解决的主要问题。一般来说，我们获得的信息所包含的不确定性，主要来自以下几个方面：（1）测量过程引入的随机误差；（2）取样随机性所带来的变化，即由于只取少数样品测量，那么取这一批样品的测量结果与取另外一批当然会有差别；（3）我们所关心的性质确实发生了某种变化。显然只有第三种改变才是我们所要检测的。统计学的任务就是在前两种干挠存在的情况下，对第三种改变是否存在给出一个科学的结论。另外需要注意的一点是统计学是可能发生错误的。由于据以作出统计判断的信息是不完全的，有误差的，我们也就无法保证统计学结论是百分之一百地正确。这与它的科学性并不矛盾，我们所面对的就是这样一个并不完美的世界，我们对这个世界的认识也只能是一种相对正确的真理，我们只能在此基础上作出尽可能正确的结论。同时，统计学一般不仅给出结论，而且给出这一结论的可靠性，即它是正确的可能性有多大。这样，我们就可以对一旦犯错误所造成的损害进行某种控制。总之，对于需要从有误差的实验数据中得出结论的科学工作者来说，统计学是一种不可或缺的工具。一、统计推断的两种途径：假设检验与参数估计作出统计判断的主要工具就是假设检验。它的基本思路是这样的：首先，根据需要判断的目标建立一个统计假设，它的主要要求是一但我们对这一假设是否成立作出了结论，就应该能够对所要判断的目标作出明确的回答；其次，根据所建立的统计假设，利用统计学知识建立起一个理论分布，根据这一理论分布必须能计算出我们观察到的实验结果出现的可能性有多大；第三步，是算出实验结果出现的可能性后，把这可能性与人为规定的一个标准（一般取为 0.05，称为显著性水平）进行比较，如果可能性大于这一标准，则认为统计假设很可能是对的，即接受统计假设；若可能性小于这一标准，说明在统计假设成立的条件下，观测到这一实验结果的可能性很小。一般来说，一个小概率事件在一次观测中是不应出现的，而现在它竟然出现了，一个合理的解释就是它实际上不是一个小概率事件，我们把它当作一个小概率事件是因为我们的统计假设不对，因此所算出来的它出现的概率也不对。在这种情况下，我们就应拒绝统计假设。这样，我们就根据实验结果对统计假设是否成立作出了判断，从而也对我们要解决的目标作出了明确的回答。根据统计假设的类型，我们可以把假设检验进一步分为参数检验和非参数检验。统计的另一个重要功能就是作出参数估计。在实践中，我们常常希望对某些参数给出估计值，例如农作物的产量，产品的合格率或使用寿命，人群中某种疾病的发病率，等等。统计学也可根据抽样结果对这一类问题作出回答。答案一般有两种类型，一种是给出该参数可

向下翻页>>

点击下载：《生物统计》第三章统计推断