正在加载图片...
P{X1=1,X2=1,x3=1} 1000010000000 显然(i)中的抽样方式不是独立的,每次抽样的结果都将影响下一次抽样的分布,这种抽 样不是我们通常研究的抽样。而(i)中的抽样,则是多次独立的抽样,它们是同分布的, 即我们通常称为的随机抽样( Random sample)。这样得到的数据,即是我们常研究的简单随机 样本( Simple random sample),或就直接称为样本。由此可以看出,对于样本(5.1),如果 每个X的共同分布为F,则样本(5.1)的分布为 F(X1)F(X2)…F(xn) (5.2) 相应地,若X有共同概率密度∫,则(5.1)的概率密度为 f(rDf(x,2).f(Xn) (5.3) 二、总体( Collectivity) 总体( Collectivity)或母体在许多教科书上通常被定义为研究对象全体的集合。其含义是, 我们观察到的样本总是由某个具体事物产生,并反映该事物的特征,这时,可以把样本视为 一些被抽取的该事物的个体,而将该事物本身视为所有个体的集合即总体。但这样说多少有 点模糊。如在例5.1中,我们自然可以将10000张抽奖券视为总体,但如果是用一架天平去 重复称同一重物,得到重物的重量,在这种事中,什么是研究对象的全体呢?因此,我们宁 愿采用另一种说法,即总体是一个随机变量,它的分布即为(5.1)中每个X的共同分布, 或者可以看作样本容量n=1时的样本X1的分布F。用这个观点叙述一些问题就显得很方便 例如样本(5.1)就可视为由总体X独立“拷贝”出来的同分布的n个随机变量。又如 Example52用两台车床车同一批产品,分别车m及n件,尺寸为X1,X2,…,Xxm及 H1,H2…,n这时,我们得到的样本是 X13X2…,xm,Y1,Y2,…,Yn (5.4) 它们显然通常不会是同分布的,但这种样本在我们的研究中经常出现。为此我们用总体的观 点,可以很方便地视它为出自两个总体X,Y的样本。有了总体这个概念,我们就可以将统 计推断的基本任务概括为由样本推断总体。如在例5.2中,我们就可以从样本(5.4)中推断 出总体X与Y是否有显著差别。关于这一基本任务,我们今后可以慢慢体会到。由于推断总 体实质上是推断总体的分布,即解决一个实际统计问题,往往归结为总体分布的确定,所以 我们也常称总体的分布是该问题的统计模型( Statistics mode 三、参数与参数空间 Parameter and parameter space) 如前所述,数理统计问题的分布一般来说是未知的,需要通过样本来推断。但如果对总 体绝对地一无所知,那么,所能做出的推断的可信度一般也极为有限。在很多情况下,往往 是知道总体所具有的分布形式,而不知道的仅仅是分布中的参数。这在实际中是大量能见到 的,因为,分布的总体形式我们往往可以通过具体的应用背景或以往的经验加以确定 Example53考虑如何由样本X1,X2,…Xn的实际背景确定统计模型,即总体X的分 (i)样本记录随机抽取的n件产品的正品、废品情况。 (i)样本表示同一批n个电子元件的寿命(小时) (i)样本表示同一批n件产品某一尺寸(mm) 通过分析或经验,我们容易知道: (i)x服从两点分布,其概率分布为p2(1-p)-x,x=0,1,所需确定的是参数p∈[0,1 (ⅱi)X通常服从指数分布,其密度函数 f(x4)=e,x>0 0 055 3 1 2 3 10000 5 10000 5 10000 5 10000 5 { 1, 1, 1}       P X = X = X = = = 显然(ⅰ)中的抽样方式不是独立的,每次抽样的结果都将影响下一次抽样的分布,这种抽 样不是我们通常研究的抽样。而(ⅱ)中的抽样,则是多次独立的抽样,它们是同分布的, 即我们通常称为的随机抽样(Random sample)。这样得到的数据,即是我们常研究的简单随机 样本(Simple random sample),或就直接称为样本。由此可以看出,对于样本(5.1),如果 每个 Xi 的共同分布为 F ,则样本(5.1)的分布为 ( ) ( ) ( ) F X1 F X2 F Xn (5.2) 相应地,若 Xi 有共同概率密度 f ,则(5.1)的概率密度为 ( ) ( ) ( ) 1 2 Xn f X f X  f (5.3) 二、 总体(Collectivity) 总体(Collectivity)或母体在许多教科书上通常被定义为研究对象全体的集合。其含义是, 我们观察到的样本总是由某个具体事物产生,并反映该事物的特征,这时,可以把样本视为 一些被抽取的该事物的个体,而将该事物本身视为所有个体的集合即总体。但这样说多少有 点模糊。如在例 5.1 中,我们自然可以将 10000 张抽奖券视为总体,但如果是用一架天平去 重复称同一重物,得到重物的重量,在这种事中,什么是研究对象的全体呢?因此,我们宁 愿采用另一种说法,即总体是一个随机变量,它的分布即为(5.1)中每个 Xi 的共同分布, 或者可以看作样本容量 n =1 时的样本 X1 的分布 F 。用这个观点叙述一些问题就显得很方便, 例如样本(5.1)就可视为由总体 X 独立“拷贝”出来的同分布的 n 个随机变量。又如 Example 5.2 用两台车床车同一批产品,分别车 m 及 n 件,尺寸为 X X X m , , , 1 2  及 Y Y Yn , , , 1 2  这时,我们得到的样本是 X X X m , , , 1 2  ,Y Y Yn , , , 1 2  (5.4) 它们显然通常不会是同分布的,但这种样本在我们的研究中经常出现。为此我们用总体的观 点,可以很方便地视它为出自两个总体 X ,Y 的样本。有了总体这个概念,我们就可以将统 计推断的基本任务概括为由样本推断总体。如在例 5.2 中,我们就可以从样本(5.4)中推断 出总体 X 与 Y 是否有显著差别。关于这一基本任务,我们今后可以慢慢体会到。由于推断总 体实质上是推断总体的分布,即解决一个实际统计问题,往往归结为总体分布的确定,所以 我们也常称总体的分布是该问题的统计模型(Statistics model)。 三、 参数与参数空间(Parameter and parameter space) 如前所述,数理统计问题的分布一般来说是未知的,需要通过样本来推断。但如果对总 体绝对地一无所知,那么,所能做出的推断的可信度一般也极为有限。在很多情况下,往往 是知道总体所具有的分布形式,而不知道的仅仅是分布中的参数。这在实际中是大量能见到 的,因为,分布的总体形式我们往往可以通过具体的应用背景或以往的经验加以确定。 Example 5.3 考虑如何由样本 X X Xn , , , 1 2  的实际背景确定统计模型,即总体 X 的分 布: (ⅰ) 样本记录随机抽取的 n 件产品的正品、废品情况。 (ⅱ) 样本表示同一批 n 个电子元件的寿命(小时)。 (ⅲ) 样本表示同一批 n 件产品某一尺寸(mm)。 通过分析或经验,我们容易知道: (ⅰ) X 服从两点分布,其概率分布为 p p x x x (1 ) , 1− − =0,1,所需确定的是参数 p [0,1] . (ⅱ) X 通常服从指数分布,其密度函数 , 0 ( ) 0, 0 x e x f x x    −   =    ;
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有