第10章非参数纺 非参数统计 亦称非参数检验,是根据样本资料对总体的某种性质或关 系进行假设检验的统计推断方法。 非参数检验与参数检验的比较 检验类别假定条件目的适用范围优点 缺点 参数检验总体呈正参数估计定距资料充分利用使用范围 态分布假设检验定比资料信息 有限 定性、定 非参数检验无限制假设检验序、定距、方法直观,信息少检 定比资料运算简单验功效低
第 10章 非参数统 计 非参数统计 亦称非参数检验,是根据样本资料对总体的某种性质或关 系进行假设检验的统计推断方法。 非参数检验与参数检验的比较 检验类别 假定条件 目的 适用范围 优点 缺点 参数检验 总体呈正 态分布 参数估计 假设检验 定距资料 定比资料 充分利用 信息 使用范围 有限 非参数检验 无限制 假设检验 定性、定 序、定距、 定比资料 方法直观, 运算简单 信息少,检 验功效低
x2检验 含义 运用2分布作为理论工具,在非参数统计中可用于对总 体的分布或随机变量的独立性进行的检验。 x2检验的原理 在实践中,经常要对一些观察值的实际频数与某种理论 频数进行比较,以判断实际结果与理论是否一致 设有k个观察值,f为它们的实际频数,为理论频数。构造一个统计 量 x2=∑(-f2)2/(k-1为自由度)
χ 2检验 • 含义 运用χ 2分布作为理论工具,在非参数统计中可用于对总 体的分布或随机变量的独立性进行的检验。 • χ 2检验的原理 在实践中,经常要对一些观察值的实际频数与某种理论 频数进行比较,以判断实际结果与理论是否一致。 设有k个观察值,f0为它们的实际频数,fe为理论频数。构造一个统计 量 ( ) / ( 1 ) 2 1 2 = − − 为自由度 = f f f k o e e k i
数理统计证明 在大量试验中,若与相一致时,x2服从x分布 (ff。)比较小时,x值也较小;(f0-f)比较大时,x2也 较大。当x值大到按x2分布超过设定的临界值时,即为小概 率事件,就可以认为实际结果与理论假设不一致 x2检验的应用 拟合优度检验:利用随机样本资料对总体是否服从某种 理论分布的检验 独立性检验 利用样本资料对总体的两个变量的数据是 否彼此关联的检验,如果不关联即为独立
• 数理统计证明 在大量试验中,若f0与fe相一致时,χ 2服从χ 2分布。 (f0 -fe)比较小时,χ 2值也较小;(f0 -fe)比较大时,χ 2也 较大。当χ 2值大到按χ 2分布超过设定的临界值时,即为小概 率事件,就可以认为实际结果与理论假设不一致。 • χ 2检验的应用 拟合优度检验: 独立性检验: 利用随机样本资料对总体是否服从某种 理论分布的检验。 利用样本资料对总体的两个变量的数据是 否彼此关联的检验,如果不关联即为独立
1、拟合优度检验 )对总体分布建立假设 检验步1:总体服从某种理论分布 H1:总体不服从该理论分布 (2)抽样并对样本资 (3)以“原假设H为真” 料编成频数分布(f 导出一组期望频数(f) (4)计算检验统计量 (5)x2=2(-f)/。给定的 2(f-f)2/f a查x2表,得到临界值 (6)比较x2值与临 界值作出检验判断
1、拟合优度检验 (1)对总体分布建立假设 H0:总体服从某种理论分布 H1:总体不服从该理论分布 (2)抽样并对样本资 料编成频数分布(f0) (3)以“原假设H0为真” 导出一组期望频数(fe) (5)χ 2=∑(f0 -fe ) 2 /fe 给定的 α查χ 2表,得到临界值 (6)比较χ 2值与临 界值作出检验判断 (4)计算检验统计量 χ 2=∑(f0 -fe ) 2 /fe 检验步骤
注意事项 (1)各组理论频数f不得小于5,如不足5可合并组; (2)为使组数不致太少,总频数n>50; (3)根据具体情况确定自由度 例题 假定总体为均匀分布的检验 假定总体为正态分布的检验 假定总体为泊松分布的检验
注意事项 (1)各组理论频数fe不得小于5,如不足5可合并组; (2)为使组数不致太少,总频数n>50; (3)根据具体情况确定自由度。 例 题 假定总体为均匀分布的检验 假定总体为正态分布的检验 假定总体为泊松分布的检验
2、独立性检验 检验步骤对总体的两个变量建说 H:两变量独立 H1:两变量关联 (3)计算理论频数 (2)将样本资料编成r×c列 联表,并列出实际频数O E 4)计算检验统计量 (5)x2=2(f-f)3/ (On-E1)2 给定的a查x2表,得到 临界值 (6)比较x2值与临界值 作出检验判断
2、独立性检验 检验步骤 (1)对总体的两个变量建立假设 H0:两变量独立 H1:两变量关联 (2)将样本资料编成r×c列 联表,并列出实际频数Oij (4)计算检验统计量 (5)χ 2=∑(f0 -fe ) 2 /fe 给定的α查χ 2表,得到 临界值 (6)比较χ 2值与临界值 作出检验判断 2 1 1 2 ( ) ij ij ij c j r i E O − E = = = n n n E i j ij = (3)计算理论频数
理论频数E的计算 先求理论频率(作为概率的近似)。概率论中关于概率独立的基本 规则:如果两事件独立,则它们的联合概率等于它们各自概率的乘积,P (AB)=P(A)P(B)因此,某一行某一列的联合概率 P(第1,的概率)m 自由度为:df(r-1)(c-1) nn 1:1 总频数为n2∴理论频数En=n( nn 例:rc=3×4De(3-1)(4-1)=6 C R R R 数 总列数
• 理论频数Eij的计算 先求理论频率(作为概率的近似)。概率论中关于概率独立的基本 规则:如果两事件独立,则它们的联合概率等于它们各自概率的乘积,P (A·B)=P(A)·P(B)。因此,某一行某一列的联合概率: n n n n P i j j i (第 , 的概率) = n n n n n n n n E n j i j i 总频数为 , 理论频数 i j = ( ) = 自由度为:df=(r-1)(c-1) 例 :r·c=3×4 √ √ √ √ √ √ ○ ○ ○ ○ ○ ○ CT1 CT2 CT3 CT4 RT1 RT2 RT3 总 行 数 总列数 r1 r2 r3 Df=(3-1)(4-1)=6 c1 c2 c3 c4
rc=2×2的列联表资料,x2值简算公式 2合计 a b a+b 2 d c+d 计 a+c b+d n n (ad-bc) (a+c)(b+a)(a+b)(c+a)
r·c=2×2的列联表资料,χ 2值简算公式 x y 1 2 1 2 a b c d a+c b+d a+b c+d 合计 合计 n ( )( )( )( ) ( ) 2 2 a c b d a b c d n ad bc x + + + + − =
成对比较检验 符号检验 含义 略去两组样本数据之差的数值,只用其差的正、负符号 进行判断的检验方法,亦称正负号检验 2检验内容 检验的两组数据是否有显著差异或两总体的位置特征 (均值、中位数)是否相同 3适用条件 关联样本资料、定性变量
成对比较检验 • 符号检验 1 含义 略去两组样本数据之差的数值,只用其差的正、负符号 进行判断的检验方法,亦称正负号检验。 2 检验内容 检验的两组数据是否有显著差异或两总体的位置特征 (均值、中位数)是否相同。 3 适用条件 关联样本资料、定性变量
4方法思 设有关联样本的两组成对的数据x与y,比较各对的大小。 若x>y1,记作“+”;若x<y13记作 若x=y1删去,并相应减少n对数据 若两组数据没有显著差异,它们之差的 “”号的个数应大致 相等。出现“+”(或“”)的概率为0.5。如果一次抽样的随机样本的配 对数据中,“+号出现过多或过少,在一定显著性水平a条件下属于小 概率事件,就说明两组数据的平均水平或相对次数分布并不相同。可见, 配对符号检验是二项检验的一种应用 接态分布近似
若两组数据没有显著差异,它们之差的“+”、“-”号的个数应大致 相等。出现“+”(或“-”)的概率为0.5。如果一次抽样的随机样本的配 对数据中,“+”号出现过多或过少,在一定显著性水平α条件下属于小 概率事件,就说明两组数据的平均水平或相对次数分布并不相同。可见, 配对符号检验是二项检验的一种应用。 § 由于P=0.5的二项分布呈对称型,所以,只要n>25, 即可按正态分布近似处理。 4 方法思想 设有关联样本的两组成对的数据xi与yi,比较各对的大小。 若xi>yi ,记作“+”;若xi<yi ,记作“-” ; 若xi=yi ,删去,并相应减少n对数据