双样本的推断 对应于 Tamhane和 Dunlop所著讲义 的第八章 幻灯片主要由 Elizabeth Newton(MIT)制作, 其中一部分由 Ramon v.Leon(田纳西大 学)制作
1 双样本的推断 • 对应于Tamhane 和 Dunlop所著讲义 的第八章 幻灯片主要由Elizabeth Newton(MIT)制作 , 其中一部分由 (田纳西大 学 )制作
绪 ·不论是试验型的还是观察型的统计学研究,其 多数是属于比较性的 最简单的比较研究是比较两个总体。 ·比较研究的两个基本原则: 一使用独立样本。 使用配对。 非正式比较的图示方法。 正态总体均值和方差的正式比较。 置信区间。 假设检验
2 绪言 • 不论是试验型的还是观察型的统计学研究,其 多数是属于比较性的。 • 最简单的比较研究是比较两个总体。 • 比较研究的两个基本原则: -使用独立样本。 -使用配对。 • 非正式比较的图示方法。 • 正态总体均值和方差的正式比较。 -置信区间。 -假设检验
独立样本设计 例:比较控制组和处理组。 见课本270页。 独立样本设计: 样本1:x1x2,…,x 不同 样本2:112…32 数字 两个样本是相互独立的。 独立样本设计依赖于随机分派,除了有处理作 用(处理因子)外使两组所有其他的性质都相 同(在平均意义上)
3 独立样本设计 例:比较控制组和处理组。 • 见课本270页。 独立样本设计: 样本 1: 不同 样本 2: 数字 • 两个样本是相互独立的。 • 独立样本设计依赖于随机分派,除了有处理作 用(处理因子)外使两组所有其他的性质都相 同(在平均意义上)
比较两 个独立 样本的 见表81和QQ图 图示法。 图8.1。图说明 处理组成本比 顺序统计中有序数控制组成本小。 组(X0yo的图,x但是这是对的吗? ya分别为相应样本 的(n+)分位数。课本中讨论了当两个样本 规模不同时,怎样建立 图形
4 比较两 个独立 样本的 见表8.1和QQ图 图示法。 图8.1。图说明 处理组成本比 顺序统计中有序数 控制组成本小。 组(x(i),y(i))的图,x(i), 但是这是对的吗? y(i)分别为相应样本 的(i/(n+1))分位数。 课本中讨论了当两个样本 规模不同时,怎样建立 图形
住院治疗费用数据的箱图 888N8o8 这个图表是使用S-PLUS(R)软件产生出来的, S-PLUS(R是 Insightful公司的一个注册商标
5 住院治疗费用数据的箱图 这个图表是使用S-PLUS ( R)软件产生出来的,S-PLUS(R) 是Insightful公司的一个注册商标
住院治疗费用数据对数化后的箱 图 这个图表是使用 S-PLUS(R)软件产生出来的,S-PLUS(R是 Insightful公司的一个注册商标
6 住院治疗费用数据对数化后的箱 图 这个图表是使用S-PLUS(R)软件产生出来的,S-PLUS(R) 是Insightful公司的一个注册商标
配对数据的图示 做出数组(xoya)的散点图。使用45直线 做参考,判断两组值是否相似或是否是 组比另一组大。 对差异或数组的比率作图可能更有用。 ·QQ图对配对数据是无效的,因为一般来 说,对于排序相同的分位数观测值并不 来自相同数组
7 配对数据的图示 • 做出数组(x(i),y(i) )的散点图。使用45 0直线 做参考,判断两组值是否相似或是否是 一组比另一组大。 • 对差异或数组的比率作图可能更有用。 • QQ图对配对数据是无效的,因为一般来 说,对于排序相同的分位数观测值并不 来自相同数组
比较两个总体的均值:独立样 本设计(大样本的情况) 假设观察值xx2…x和1…是来 自于均值分别是山和{2,方差分别是G 和G的两个总体中的随机样本。均值和 方差假设都是未知的。目的是用差异Ar42 比较A和2。此时假设n和n2足够大(大 于30)
8 比较两个总体的均值:独立样 本设计(大样本的情况) 假设观察值 和 是来 自于均值分别是 和 ,方差分别是 和 的两个总体中的随机样本。均值和 方差假设都是未知的。目的是用差异 比较 和 。此时假设 n 1 和 n 2足够大(大 于30)
比较两个总体的均值:独立样本设计 E(X-1)=E()-E()=一 r(x-1)=m()+r()=+ 所以标准随机变量 x-1-(-2) 有均值=0,方差=1。VG+G 如果n和n2足够大,那么尽管我们没有假设样 本来自正态总体,但据中心极限定理,Z近似 于N(0,)分布。(我们也运用“独立正态随机变 量的差异分布也是正态的”的事实。)
9 比较两个总体的均值:独立样本设计 所以标准随机变量 有均值= 0,方差= 1 。 如果 n 1 和 n 2足够大,那么尽管我们没有假设样 本来自正态总体,但据中心极限定理, Z近似 于N(0,1)分布。(我们也运用 “独立正态随机变 量的差异分布也是正态的 ”的事实。)
大样本情况下μ1-中2的100-ax9的置信 区间的近似: 一+s44(+= 这里用S2替代了σ,因为样本规模足够 大,即,大于30。 例82:见课本例8,2
10 大样本情况下 的 的置信 区间的近似: 这里用 替代了 ,因为样本规模足够 大,即,大于30 。 • 例8.2:见课本例8.2