第二章 一、化学计量学介绍 a brief introduction of 计算机与仪器分析 chemometrics computer and instrument 二、信息评价 analysis information appraise 第三节 三、信号与噪声 信息处理与数据挖 signal and noise 掘技术 四、信号的处理技术 information process and technology of signal process technology of date excavate 五、多元分析方法 polybasis analysis methods 下一页
第二章 计算机与仪器分析 一、化学计量学介绍 a brief introduction of chemometrics 二、信息评价 information appraise 三、信号与噪声 signal and noise 四、信号的处理技术 technology of signal process 五、多元分析方法 polybasis analysis methods 第三节 信息处理与数据挖 掘技术 computer and instrument analysis information process and technology of date excavate
、化学计量学简介 a brief introduction of chemometrics 化学计量学:化学与计算机结合的产物 1974年,Kowalski与Wold提出建立国际化学计量学协会 任务:运用数学和统计的方法设计或选择最佳测试过程和实验 通过化学数据分析提供更多化学信息。 范畴:纯化学与量子化学之间凡涉及计算和计算机的所有领域 应用举例:大连湾海水污染物与污染源之间的关系;控制 由尿样获取身体健康状况的全部信息;简化 化合物性质数据—结构,结构与性质的关系;新药 产品质量检验—生产中的问题;决策 犯罪现场的烟雾分析:香烟牌号,种类; 破案 23:09:17
23:09:17 一 、化学计量学简介 a brief introduction of chemometrics 化学计量学:化学与计算机结合的产物 1974年,Kowalski 与Wold 提出建立国际化学计量学协会 任务:运用数学和统计的方法设计或选择最佳测试过程和实验 通过化学数据分析提供更多化学信息。 范畴:纯化学与量子化学之间凡涉及计算和计算机的所有领域。 应用举例:大连湾海水污染物与污染源之间的关系;控制 由尿样获取身体健康状况的全部信息;简化 化合物性质数据——结构,结构与性质的关系;新药 产品质量检验——生产中的问题;决策 犯罪现场的烟雾分析:香烟牌号,种类;破案
二、 信息评价 information appraise 分析仪器是分析化学家为获取化学信息所使用的工具, 因此可以由信息理论来评价仪器的性能。 1.信息量和熵 设有一事件有几种可能性,他们各自的概率为P, Shannon定义信息熵: H(p,P,Pn)=-∑p,gp 在信息理论中,习惯取“2”作为对数的底,此时单位 为bit(e为底,nat)。设有一具有两种可能性的等概率事件: 即n=n=则a )=1 bit 同理H(, 111 =2 bit 23:09:17
23:09:17 二、 信息评价 information appraise 分析仪器是分析化学家为获取化学信息所使用的工具, 因此可以由信息理论来评价仪器的性能。 1. 信息量和熵 设有一事件有几种可能性 ,他们各自的概率为pi, Shannon定义信息熵: = = − n i n i i H p p p p p 1 1 2 ( , ,, ) lg 在信息理论中,习惯取“2”作为对数的底,此时单位 为bit(e为底,nat)。设有一具有两种可能性的等概率事件: ) 1bit 2 1 , 2 1 ( 2 1 即 p1 = p2 = 则 H = ) 2 bit 4 1 , 4 1 , 4 1 , 4 1 同理 H( =
信息量和熵 熵是事件不确定程度的度量,不确定程度越大,熵就越 大。对于一个概率密度为(x)的连续型分布熵的定义为: HIp()=["p(x)lg p(x)dx 信息的概念是与事件发生的概率相联系的,出现小概率 事件所包含的信息量大,因此可定义信息量: I=-lgpi 如果事件发生后的概率不等于1,即它是不确定的,则信 息量可表示为: I=g(gilp) 式中:是事件发生后的概率。 2309:17
23:09:17 信息量和熵 熵是事件不确定程度的度量,不确定程度越大,熵就越 大。对于一个概率密度为p(x)的连续型分布熵的定义为: − H[ p(x)] = p(x)lg p(x)dx 信息的概念是与事件发生的概率相联系的,出现小概率 事件所包含的信息量大,因此可定义信息量: I = -lgpi 如果事件发生后的概率不等于1,即它是不确定的,则信 息量可表示为: I =lg(qi /pi ) 式中 qi 是事件发生后的概率
2. 信息量与熵的关系 如果通过某些方法获取信息使原来事件的不确定程度减 小,所得到的信息的数量就是信息量,故信息量就是熵减少 的量: I=Ho-H 式中H和H分别表示获取“情报”前后,事件不确定程度 。在分析化学中则是实验前后的熵。若经过实验后的结果完 全确定,即实验后的熵=0,则: I=Ho =Hmax 即经过这样一个实验后,可能得到的最大信息量。 23:09:17
23:09:17 2. 信息量与熵的关系 如果通过某些方法获取信息使原来事件的不确定程度减 小,所得到的信息的数量就是信息量,故信息量就是熵减少 的量: I = H0 - H 式中 H0 和H 分别表示获取“情报”前后,事件不确定程度 。在分析化学中则是实验前后的熵。若经过实验后的结果完 全确定,即实验后的熵=0,则: I = H0 =Hmax 即经过这样一个实验后,可能得到的最大信息量
3. 分析化学实验中的信息量与熵 在定性分析实验中,判断某一组分是否存在。 实验前: 概率:各为1/2((实验前并无任何信息) =1 bit 实验后:H=0 故信息量: I=H-H=1 bit 如果采用仪器分析定性,不能将全部组分检测出,如何确定? 例:原子吸收测定含铜、锌试样(组成未知)。 仅测定出Cu2+时的信息量,测定出Cu2+、Zn2+时的信息量 分别是多少?(阴离子不能检测) 23:09:17
23:09:17 3. 分析化学实验中的信息量与熵 在定性分析实验中,判断某一组分是否存在。 实验前: 概率:各为1/2(实验前并无任何信息) H0 = 1 bit 实验后: H =0 故信息量: I = H0 - H = 1 bit 如果采用仪器分析定性,不能将全部组分检测出,如何确定? 例:原子吸收测定含铜、锌试样(组成未知)。 仅测定出Cu2+时的信息量,测定出Cu2+ 、 Zn2+时的信息量 分别是多少?(阴离子不能检测)
4.定量分析中有关参数与信息量 在定量分析实验中,如果实验前知道某一组分的大致范 围时,即p(x)均匀地分布在(x,)区间内,则: dx In(x2x) X1-X2X2-X1 由于分析中偶然误差的存在,结果不可能是一定值而成 正态分布。设其标准偏差为σ,则: H=o》 =ln(o2re) 23:09:17
23:09:17 4. 定量分析中有关参数与信息量 在定量分析实验中,如果实验前知道某一组分的大致范 围时,即p(x)均匀地分布在(x1,x2)区间内,则: d ln( ) 1 ln 1 2 1 1 2 2 1 0 2 1 x x x x x x x H x x = − − − = − 由于分析中偶然误差的存在,结果不可能是一定值而成 正态分布。设其标准偏差为σ,则: ln( 2π ) d 2 exp 2π 1 ln 2 exp 2π 1 2 2 2 2 e x x x H = − = − − −
于是: I=Ho-H=In X2-X1 σ越小,信息量越大。实验中增大信息量的途径? 减少干扰、提高仪器灵敏度、减小噪声、增加测定次数等。 23:09:17
23:09:17 于是: e x x I H H 2π ln 2 1 0 − = − = σ越小,信息量越大。实验中增大信息量的途径? 减少干扰、提高仪器灵敏度、减小噪声、增加测定次数等
5.仪器的最大信息量 分析仪器通常有一测定限cain’待测试样浓度低于此值时 不能用该仪器测定。该仪器实验前的熵为: C H=g △c △c为仪器能分辨的最小浓度差,实际的信息量: I=Ho-H=In min max 23:09:17
23:09:17 5. 仪器的最大信息量 分析仪器通常有一测定限cmin,待测试样浓度低于此值时 ,不能用该仪器测定。该仪器实验前的熵为: c c H = min 0 lg Δc 为仪器能分辨的最小浓度差,实际的信息量: max min 0 2π ln I e c I = H − H =
对于多通道的仪器,可以有个通道同时测定种组分, 其总的信息量是各通道的信息量之和: I=∑1,=Σn Cmin In Cimin'C2min'C3minCumin C10203.0n(2m)2 单位时间内信息量的变化称为信息流: dt 理想的分析仪器应该在很短的时间内获得很大的信息量。 23:09:17
23:09:17 对于多通道的仪器,可以有n个通道同时测定n种组分, 其总的信息量是各通道的信息量之和: 1/ 2 1 2 3 1min 2min 3min min min (2π ) ln 2π ln = = = n n i c c c c e c I I 单位时间内信息量的变化称为信息流: t I J d d = 理想的分析仪器应该在很短的时间内获得很大的信息量