§41统计决策的基本概念 、统计判决问题的三个要素 为了估计一个未知参数,需要给出一个合适的 估计量,该估计量也称为该统计问题的解。一般地 说,一个统计问题的解就是所谓的统计决策函数。 为了明确统计决策函数这一重要概念,需对构成一 个统计决策问题的基本要素作一介绍。这些要素是: 样本空间和分布族;行动空间以及损失函数。以下 逐点介绍。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 1 §4.1 统计决策的基本概念 一、统计判决问题的三个要素 为了估计一个未知参数,需要给出一个合适的 估计量,该估计量也称为该统计问题的解。一般地 说,一个统计问题的解就是所谓的统计决策函数。 为了明确统计决策函数这一重要概念,需对构成一 个统计决策问题的基本要素作一介绍。这些要素是: 样本空间和分布族;行动空间以及损失函数。以下 逐点介绍
1.样本空间和分布族 定义设总体X的分布函数为F(x),O是未知参数O∈⊙, 称为参数空间。若(X1,X2,…,X)为取自总体X的一个样本, 则样本所有可能值组成的集合称为样本空间,记为S,由 于X的分布函数为F(x;)=12…,n,则(X1…X)的联合 分布函数为 F(x2…,x;0)=∏F(x:0),O∈⊙ 若记-∏(x,则称F为样本(x,…,x,)的概率 分布族,简称分布族。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 2 1.样本空间和分布族 定义 设总体X 的分布函数为F x( ; ) , 是未知参数 , 称为参数空间。若 1 2 ( , , , ) X X Xn 为取自总体 X 的一个样本, 则样本所有可能值组成的集合称为样本空间,记为 S ,由 于 Xi的分布函数为 ( ; ), 1,2, , F x i n i = ,则 1 ( , , ) X Xn 的联合 分布函数为 1 1 ( , , ; ) ( ; ), n n i i F x x F x = = 若记 1 ( ; ), n i i F F x = = ,则称 * F 为样本 1 ( , , ) X Xn 的概率 分布族,简称分布族
例4.1设总体X服从两点分布B(,p),P为未知参数, 0≤P≤1,(X1,…,Xn)是取自总体X的样本, 则样本空间是集合 1 ·"n ):x=0,1,=12,…,n 它含有2个元素,样本(x1…,Xn)的分布族为 XX F={p(1-p)ax2=0i=1,2,…,n,0≤p≤1 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 3 例 4.1 设总体X 服从两点分布B p (1, ) ,p 为未知参数, 0 1 p , 1 ( , , ) X X n 是取自总体X 的样本, 则样本空间是集合 = = = ( , , ) : 0,1, 1, 2, , x x x i n 1 n i 。 它含有2 n 个元素,样本 1 ( , , ) X Xn 的分布族为 * 1 1 (1 ) 0.1, 1,2, , ,0 1 n n i i i i x n x F p p x i n p i = = − = − = =
2.决策空间(或称判决空间) 对于一个统计问题,如参数的点估计,一个具体的估 计值就是一个回答。在统计决策中,每一个具体的回答 称为一个决策,一个统计问题中可能选取的全部决策组 成的集合称为决策空间,记为E。一个决策空间E至 少应含有两个决策,假如E中只含有一个决策,那人们 就无需选择,从而也形成不了一个统计决策问题。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 4 2.决策空间(或称判决空间) 对于一个统计问题,如参数 的点估计,一个具体的估 计值就是一个回答。在统计决策中,每一个具体的回答 称为一个决策,一个统计问题中可能选取的全部决策组 成的集合称为决策空间,记为 * E 。一个决策空间 * E 至 少应含有两个决策,假如 * E 中只含有一个决策,那人们 就无需选择,从而也形成不了一个统计决策问题
例如,要估计正态分布N(A0)中的参数 ,H∈⊙=(-∞,+∞)。因为在(=,+∞)中取值,所以 每一个实数都可用来估计,故每一个实数都代表一个 决策,决策空间为=(-∞,+∞)。 值得注意的是,在中具体选取那个决策与抽取的样本 和所采用的统计方法有关。 例4.2某厂打算根据各年度市场的销售量为决定下年度 应该扩大生产还是缩减生产,或者维持原状,这样决策 空间为 ={扩大生产,缩减生产,维持原状} 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 5 例如,要估计正态分布 2 N( , ) 中的参数 , ( , ) = − + 。因为 在( , ) − + 中取值,所以 每一个实数都可用来估计 ,故每一个实数都代表一个 决策,决策空间为 = − + ( , )。 值得注意的是,在 中具体选取那个决策与抽取的样本 和所采用的统计方法有关。 例4.2 某厂打算根据各年度市场的销售量为决定下年度 应该扩大生产还是缩减生产,或者维持原状,这样决策 空间 为 = 扩大生产,缩减生产,维持原状
3.损失函数 统计决策的一个基本观点和假定是,每采取一个决策,必 然有一定的后果(经济的或其他的),决策不同的,后果 各异。对于每个具体的统计决策问题,一般有多种优劣不 同的决策可采用。例如,要估计正态分布N(20.2)中 的参数u,假设u的真值为3,那么采用3.5这个决策显 然比10这个决策好的多。如果要作的区间估计,则显 然[2.4这个决策比[-5,10这个决策好。 湘潭大学数学与计算科学院一页一页]6
湘潭大学数学与计算科学学院 上一页 下一页 6 3.损失函数 统计决策的一个基本观点和假定是,每采取一个决策,必 然有一定的后果(经济的或其他的),决策不同的,后果 各异。对于每个具体的统计决策问题,一般有多种优劣不 同的决策可采用。 例如,要估计正态分布 2 N( ,0.2 ) 中 的参数 ,假设 的真值为 3,那么采用 3.5 这个决策显 然比 10 这个决策好的多。如果要作 的区间估计,则显 然[2.4]这个决策比[-5,10]这个决策好
统计决策理论的一个基本思想是把上面所谈的优劣 性,以数量的形式表现出来,其方法是引入一个依赖于参 数值O∈⊙和决策d!∈E”的二元实值非负函数 L(,d)≥0,称之为损失函数,它表示当参数真值为O而 采取决策d时所造成的损失,决策越正确,损失就越小。 由于在统计问题中人们总是利用样本对总体进行推断,所 以误差是不可避免的,因而总会带来损失,这就是损失函 数定义为非负函数的原因。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 7 统计决策理论的一个基本思想是把上面所谈的优劣 性,以数量的形式表现出来,其方法是引入一个依赖于参 数 值 和 决 策 * d E 的 二 元 实 值 非 负 函 数 L d ( , ) 0 ,称之为损失函数,它表示当参数真值为 而 采取决策d 时所造成的损失,决策越正确,损失就越小。 由于在统计问题中人们总是利用样本对总体进行推断,所 以误差是不可避免的,因而总会带来损失,这就是损失函 数定义为非负函数的原因
例4.3设总体X从正态分布N(0,1),O为未知参数,参数 空间⊙=(-∞,+∞),决策空间自然地取为E=(-,+∞), 个可供考虑的损失函数是 L(O,d)=(O-)2 当d=O,即估计正确时损失为0,估讪与实际值的距离 d-愈大,损失也愈大。 如果要求未知参数的区间估计,损失函数可取为 L(,d)=(d2-d1),b∈⊙,d=[d1,d2l∈ 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 8 例 4.3 设总体 X 从正态分布N( ,1) , 为未知参数,参数 空间 = − + ( , ) ,决策空间自然地取为 * E = − + ( , ), 一个可供考虑的损失函数是 2 L d d ( , ) ( ) = − 当d = ,即估计正确时损失为 0,估计d 与实际值 的距离 d − 愈大,损失也愈大。 如果要求未知参数 的区间估计,损失函数可取为 2 1 1 2 L d d d d d d ( , ) ( ), , [ , ] = − =
其中={d1,d21:-∞<d1<d2<∞,这个损失函数表示以 区间估计的长度来度量采用决策d=d1d21所带来的损 失,也可以取损失函数为 L(,d)=1-1a,a1(),6∈0,d=[a1,d2le 其中{4a1()是集合d1dl的示性函数,即 0,当g[ddl2]时, 1(1当时 这个损失函数表示当决策d正确(即区间[4,d421复盖未知 参数的实际值)时损失为0,反之损失为1。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 9 其中 = − [ , ]: d d d d 1 2 1 2 ,这个损失函数表示以 区间估计的长度来度量采用决策 1 2 d d d = [ , ] 所 带来的损 失,也可以取损失函数为1 2 [ , ] 1 2 ( , ) 1 ( ), , [ , ] L d I d d d = − = d d 其中 1 2 [ , ]( ) d d I 是集合 1 2 [ , ] d d 的示性函数,即 1 2 1 2 [ , ] 1 2 0, [ , ] ( ) 1, [ , ] d d d d I d d = 当 时, 当 时, 这个损失函数表示当决策d 正确(即区间 1 2 [ , ] d d 复盖未知 参数的实际值)时损失为 0,反之损失为 1
对于不同的统计问题,可以选取不同的损失函数,常见 的损失函数有以下几种。 (1)线性损失函数 L(6,a) ∫k(-d),d≤b k(d-,d>, (4.1) 其中和k是两个常数,它们的选择常反映行动d低于参 数6和高于参数的相对重要性, 当k=k时就得到,绝对值损失函数 L(2,d)=l()0-a (4.2) 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 10 对于不同的统计问题,可以选取不同的损失函数,常见 的损失函数有以下几种。 (1)线性损失函数 0 1 ( ), , ( , ) ( ), , k d d L d k d d − = − (4.1) 其中 0 k 和 1 k 是两个常数,它们的选择常反映行动d 低于参 数 和高于参数 的相对重要性, 当 0 1 k k = 时就得到, 绝对值损失函数 L d d ( , ) ( ) = − 。 (4.2)