己H厄与 第五章:非参数检验方法 5 弹统计在 学中的
数理统计在化学中的应用 第五章:非参数检验方法
Center for Theoretical Chemical Physics Laboratory of Molecular Catalysis Innovative Material $5.1非参数检验方法概迷 脓参数镜计是一种不要求变量值为幕种特定分饰和 不像赖某种特定理论的镜计方法,或者是在不了解 总体分市及其金部参数的情况下的镜计方法。 非参数镜计方法开始子20世纪中期,早期的将号检验 可以追溯到18世纪。实际工作中,有许多资料常不能 确定或假设其总体变量值的分布,因此参数统计不宜 使用,不知道怎分市,就不能比餐参数,而只能比餐 非参数。所谓非参数,即指数据的正负将号,大小顺 序号,综合判断所划分的名次、严重程度、优劣等级 等, 利用直接税明或比敏面个或儿个样库的旅参数的 方信怕属子旅参数镜计法。 数理统计在化学中的应用 李振华制造
李 振 华 制 数理统计在化学中的应用 造 $5.1 非参数检验方法概述 非参数统计是一种不要求变量值为某种特定分布和 不依赖某种特定理论的统计方法,或者是在不了解 总体分布及其全部参数的情况下的统计方法。 非参数统计方法开始于20世纪中期,早期的符号检验 可以追溯到18世纪。实际工作中,有许多资料常不能 确定或假设其总体变量值的分布,因此参数统计不宜 使用,不知道总分布,就不能比较参数,而只能比较 非参数。所谓非参数,即指数据的正负符号,大小顺 序号,综合判断所划分的名次、严重程度、优劣等级 等,利用直接说明或比较两个或几个样本的非参数的 方法均属于非参数统计法
Center for Theoretical Chemical Physics Laboratory of Molecular Catalysis &Innovative Material 参数检验和非参数检验 参数检验:指总体分布服从正态分市或总体分布 已知条件下的铣计检验。 旅参数检验:指怎体分布不要求服从正态分市或总 体分布情况不明时,用来检验煞据资料是香来自同 一个总休的镜计检验方法。 李振华制 数理统计在化学中的应用 造
李 振 华 制 数理统计在化学中的应用 造 参数检验和非参数检验 参数检验:指总体分布服从正态分布或总体 分布 已知条 件下的统计检验。 非参数检验:指总体分布不要求服从正态分布或总 体分布情况不明时,用来检验数据资料是否来自同 一个总体的统计检验方法
Center for Theoretical Chemical Physics Laboratory of Molecular Catalysis &Innovative Material 通常非参数统计方法适用于以下儿种情况 未知分布型,或样本数太少(≤6)而使得分布状 况尚未显示出来 非参数性,只能以严重程度、优劣等级、效果 大小、名次先后以及综合判断等方式记录其符 号或等级 分布程度偏态 组内个别随机变量偏离过大。 数理统计在化学中的应用 李振华制造
李 振 华 制 数理统计在化学中的应用 造 通常非参数统计方法适用于以下几种情况 未知分布型,或样本数太少(n6)而使得分布状 况尚未显示出来 非参数性,只能以严重程度、优劣等级、效果 大小、名次先后以及综合判断等方式记录其符 号或等级 分布程度偏态 组内个别随机变量偏离过大
Center for Theoretical Chemical Physics Laboratory of Molecular Catalysis Imnovative Material 非参数检验的优点和缺点: 优点 不受总体分布的限制,适用范围广, 不致因为 对总体分布的假定不当而导致重大错误,所以它 往往有较好的稳健性 b. 适宜定量模糊的变量和等级变量。 C. 方法简便易学。 缺点:当测量的数据能够满足参数镜计的所言憾设时,非 参数检验方法虽赋也可以使用,但数果远不品参数检验方 佐。由于当数据满足假设条件时,参数铣计检验方法能够 从其中广泛地克分地提取有关信息。旅参数铣计检验方法 对数裾的很制餐为宽松,只能从中提取一般的信息,相对 参数镜计检验方佐会浪费一些信息。 数理统计在化学中的应用 振华测造
李 振 华 制 数理统计在化学中的应用 造 非参数检验的优点和缺点: 优点: a. 不受总体分布的限制,适用范围广,不致因为 对总体分布的假定不当而导致重大错误,所以它 往往有较好的稳健性 b. 适宜定量模糊的变量和等级变量。 c. 方法简便易学。 缺点:当测量的数据能够满足参数统计的所有假设时,非 参数检验方法虽然也可以使用,但效果远不如参数检验方 法。由于当数据满足假设条件时,参数统计检验方法能够 从其中广泛地充分地提取有关信息。非参数统计检验方法 对数据的限制较为宽松,只能从中提取一般的信息,相对 参数统计检验方法会浪费一些信息
Center for Theoretical Chemical Physics of Molecular Catalysis Innovts $5.2 Pearson'sX2拟合检验 需要研究所研宪的对象或者实验的猪果是香与预期 的原假设之间有显著性的差异,也就是检验观察值 与理论值之间的紧密程度。X2拟合检验就是用来确 定事件出现的频数分布与某一理论分布之间的差别 是云是随机性的 ■ X2定义 实测值或观 察值频数 X=20-) (v=m-1) m→00 k=1 T k= 62 理论数 试验猪果只有两 的期望值 个,且频数轻小 x- (0-T-0.5)2 T 李振华制 数理统计在化学中的应用
李 振 华 制 数理统计在化学中的应用 造 $5.2 Pearson’s X2拟合检验 需要研究所研究的对象或者实验的结果是否与预期 的原假设之间有显著性的差异,也就是检验观察值 与理论值之间的紧密程度。X2拟合检验就是用来确 定事件出现的频数分布与某一理论分布之间的差别 是否是随机性的。 X2定义: 2 2 1 ( ) ( 1) m k k k k O T v m T X 理论频数 的期望值 实测值或观 察值频数 m→∞ 2 2 2 1 ( ) m k k x 2 2 2 1 ( 0.5) k k k k O T T X 试验结果只有两 个,且频数较小
Center for Theoretical Chemical Physics Laboratory of Molecular Catalysis Innovative Material $5.2 Pearson's chi-square test 如果检验的参数是一个特定值,比如产品的不合格率 由子产品的合格与不合格问题属于二项式分布,此时 就还可以用: p:观察值 的期望值 X-Σ-“,apf np n(1-p) Y-np) (v=1) np(1-p) 观察值 李振华制 数理统计在化学中的应用
李 振 华 制 数理统计在化学中的应用 造 $5.2 Pearson's chi-square test 如果检验的参数是一个特定值,比如产品的不合格率, 由于产品的合格与不合格问题属于二项式分布,此时 就还可以用: 2 2 2 2 2 ( ) ( ) [ (1 )] = (1 ) ( ) = ( 1) (1 ) Y np Y np n Y n p np np n p Y np v np p X 观察值 np: 观察值 的期望值
Center for Theoretical Chemical Physics Laboratory of Molecular Catalysis &Inmovative Material $5.2.1X2拟合检验的步骤 1.把观察到的不同类别的频数分别归入k类,这些频 数之和应是独立观察到总频数之和。 2.假设H0,即确定出李一美应有的期望数Tk(或p) 如>2,只要有20%的Tk(或p)<5,就要合并 相邻精度类别以减少k值,以此来增加某些Tk值。 如=2,只有当T都≥5时,才能应用式5-1来进行X2 检验,否则就需要应用修正式来检验。 3.计算X2。 4.根据给定的置信桡率,查X2分布表,如果计算值 于表值,则接受H,反之则拒绝。 数理统计在化学中的应用 振华测造
李 振 华 制 数理统计在化学中的应用 造 $5.2.1 X2拟合检验的步骤 1. 把观察到的不同类别的频数分别归入k类,这些频 数之和应是独立观察到总频数之和。 2. 假设H0,即确定出每一类应有的期望数Tk(或np) 。如k>2,只要有20%的Tk(或np)<5,就要合并 相邻精度类别以减少k值,以此来增加某些Tk值。 如k=2,只有当Tk都≥5时,才能应用式5-1来进行X2 检验,否则就需要应用修正式来检验。 3. 计算X2 。 4. 根据给定的置信概率,查X2分布表,如果计算值小 于表值,则接受H0,反之则拒绝
[例]为了分析产生误差的原因,用随机读取滴定管读数的方法来分析实验人员的观测误 差,一个学生在100次随机选择的读取滴定管读数的结果中,最后一位的估读数字的分布如 下: 估读数字 0 3 4 5 6 7 8 9 频数 19 7 11 6 9 16 8 5 13 6 试问该学生读取滴定管读数时有无明显的观测误差? 解:Ho:Og=TxH:0k>Tx 在随机读取的末尾读数中。0~9这10个数字出现的机会应是相等的,因此 Tx=100X1/10=10 X2=员0,-7)°_9-102+0-10+…+6-10=198 i=l T 10 10 10 查X2分布表,α取0.05f=9 查得X59(单侧)=16.92 19.8>16.92 . H成立, 即该学生读取滴定管读数的末尾估读 数时是有偏的,明显地0和5的几率偏高。 振华制 数理统计在化学中的应用
李 振 华 制 数理统计在化学中的应用 造 b
Center for Theoretical Chemical Physics Laboratory of Molecular Catalysis &Innovative Material 例5-2 一试剂公司按现行生产工艺生产的化学试剂,其优品 率要占到10%。现从一批产品中抽取100个进行检验, 结果发现优级品仅5个。问是否优级品率出现了下降 的变化(a=0.05)7 X=2g.50e,5b00 100×0.1 100×0.9 「Y-p (5-100×0.1)2 =2.78 mpl-p) 100×0.1×0.9 X6.o5,1=CHS0.INV.RT(0.05,1)=CHS0.INV(0.95,1)=3.84 因为X2<X2005,1, 所以优级品率没有出现下降的变化。 李振华制 数理统计在化学中的应用 造
李 振 华 制 数理统计在化学中的应用 造 例5-2 一试剂公司按现行生产工艺生产的化学试剂,其优品 率要占到10%。现从一批产品中抽取100个进行检验, 结果发现优级品仅5个。问是否优级品率出现了下降 的变化(𝛼=0.05)? 2 2 2 2 2 2 ( ) (5 100 0.1) [95 100 0.9] = 100 0.1 100 0.9 ( ) (5 100 0.1) 2.78 (1 ) 100 0.1 0.9 Y np np Y np np p X 因为X2 < X2 0.05,1, 所以优级品率没有出现下降的变化。 𝑿𝟎.𝟎𝟓,𝟏 𝟐 = 𝐂𝐇𝐈𝐒𝐐.𝐈𝐍𝐕.𝐑𝐓 𝟎. 𝟎𝟓, 𝟏 = 𝐂𝐇𝐈𝐒𝐐.𝐈𝐍𝐕 𝟎. 𝟗𝟓, 𝟏 = 𝟑. 𝟖𝟒