清华大学：《粒子物理与核物理实验中的数据分析》课程教学资源（课件讲稿）第十二讲开拆法（陈少敏）

数学公式,反应函数(矩阵) 求反应矩阵的逆修正因子正规化的开拆法估计量的方差与偏置正规化参数的选择举例 a) Tikhonov 规则 b) MaxEnt 规则

团购合买资源类别：文库，文档格式：PDF，文档页数：25，文件大小：450.17KB

粒子物理与核物理实验中的数据分析陈少敏清华大学第十二讲：开拆法

本讲要点数学公式，反应函数（矩阵）求反应矩阵的逆修正因子 ·正规化的开拆法 a)Tikhonov规则 b)MaxEnt规则 ·估计量的方差与偏置 ·正规化参数的选择举例 2

2 本讲要点数学公式,反应函数(矩阵) 求反应矩阵的逆修正因子正规化的开拆法估计量的方差与偏置正规化参数的选择举例 a) Tikhonov 规则 b) MaxEnt 规则

图像还原问题个常见的问题：由于实验仪器的原因而出现图像变形，例如 10000 30000 10000 8000 25000 8000 20000 6000 6000 15000 4000 4000 10000 2000 2000 5000 aae1e4+1414a1e411t。4 4LL4LLL上L44L -1 -0.5 00.51152 -1080.6040200.20.40.60.81 1 0500.5 1152 真实分布如果，已知通过探测器模拟可以实验观测分布给出其影响的形式能否还原出不受实验仪器影响的分布？ → Unfolding(开拆法) 3

3 图像还原问题 ⊗ ＝一个常见的问题：由于实验仪器的原因而出现图像变形，例如如果，已知通过探测器模拟可以给出其影响的形式实验观测分布能否还原出不受实验仪器影响的分布？能否还原出不受实验仪器影响的分布？ Unfolding(开拆法 ) 真实分布

开拆问题的表述考虑有随机变量y,我们的目标是要找到概率密度函数f(y) 如果函数可参数化为f(y,O),那么确定概率密度函数，等效于最大似然法若无参数化形式，可通过构造直方图 80 P,=lin f(ydy )j=1,,M 60 4=4oP,☐"真实的直方图" 40 目标：为4，（或p)构造估计量 20 参数的数日=区间的数目M 问题：y在测量时不可能没有误差各区间之间填入的数目互 bin j 串，导致f(y)散开变宽。 4

4 开拆问题的表述考虑有随机变量，我们的目标是要找到概率密度函数如果函数可参数化为，那么确定概率密度函数，等效于若无参数化形式，可通过构造直方图 y f ( y ) ( ;θ ) G f y 最大似然法 θ ˆ G bin ( ) 1,..., j j j t ot j p f y dy j M μ μ p = = = ∫ “真实的直方图 ” 目标：为 μ j ( 或 p j )构造估计量问题： y 在测量时不可能没有误差参数的数目 =区间的数目 M () f y 各区间之间填入的数目互串,导致散开变宽

反应矩阵测量误差的影响：y=真值； X= 观测值 fmeas(x)=R(xIy)fre(y)dy 反应矩阵观测直方图写成离散形式 (期待值) M i=1,,N R=P(观测值在第i区|真实值在第j区) 真实直方图数据：n=(n12,nw) 400 400 这里Y:=E[n] 200 200 注意：d,是常数，n会受到统计涨落的影响。 0 0.250.50.75 0.25 0.5 0.75 5

5 反应矩阵测量误差的影响: 数据： y = 真值； x = 观测值 ∫ f x = R x y f y dy meas true ( ) ( | ) ( ) 写成离散形式 R i N M j i ij j , 1,..., 1 = ∑ = = ν μ 观测直方图 (期待值) 反应矩阵真实直方图 ( | ) R P ij = 观测值在第 i 区真实值在第 j 区 [ ] ( ,..., ) 1 i i N E n n n n = = ν G 这里注意：是常数，会受到统计涨落的影响。 μ ν G G , n G

效率，本底有时侯，事例可能会不被探测到立R,=立P(观测值在第i区真实值在第/区 i=l P(观测值在全范围！真实值在第区) =6,(效率) 取决于在第j区的真实直方图有时在无真实事例发生的 400 时候，也有事例被观测到 M 0.5 =∑R,4+B i=1 0 00.250.50.75 0 0.25 0.5 0.75 B是在观测直方图上预期的本底数目，并假设它是已知的。 6

6 效率，本底有时侯，事例可能会不被探测到是在观测直方图上预期的本底数目，并假设它是已知的。有时在无真实事例发生的时候，也有事例被观测到 1 1 ( | ) ( | ( ) N N ij i i j R P i j P j ε = = = = = ∑ ∑ 观测值在第区真实值在第区观测值在全范围真实值在第区) 效率 ∑= = + M j i Rij j i 1 ν μ β βi 取决于在第 j 区的真实直方图

各关键量总汇 M 真实"直方图：=(4，，4M) 4o=∑4 M个区间 i=1 概率：p=(P1,pM)=i/4o 观测直方图的期待值：=(y1,,VN) N个区间观测直方图：n=(n,,nw) 反应矩阵：R=P(观测值在第i区|真实值在第j区) 效率：6，=∑R 预期的本底：B=(B,Bx) i= ETn]==Rii+B 为了找到u的估计量，需要相关的概率理论，例如：P(,;y) 上 n 泊松分布，或关联矩阵V,=Cov[n,n,]以便构造logL或X

7 各关键量总汇 “真实 ”直方图: 观测直方图的期待值: 反应矩阵: 效率: ∑= = = M j M tot j 1 1 μ ( μ ,..., μ ), μ μ 概率: 观测直方图: G M tot p ( p1,..., p ) μ / μ G G = = ( ,..., ) ν = ν 1 ν N G ( ,..., ) 1 N n = n n G ( | ) R P ij = 观测值在第 i 区真实值在第 j 区 ∑= = N i j Rij 1 ε ( ,..., ) 预期的本底: β = β1 β N G ν μ β G G G G E [ n ] = = R + 为了找到的估计量，需要相关的概率理论，例如: i i e n P n i n i i i ν ν ν − = ! ( ; ) 泊松分布，或关联矩阵 Vij = cov[ ni , n j ] 以便构造 2 log L 或 χ μ G M个区间 N个区间

为什么要用开拆法般而言，我们并不需要开拆法，例如当比较现有理论的预期值时，最好是将探测器相应叠加到理论中去。即在预期值中包含探测器效应并与未修正的原始数据n相比较。但是，不将实验数据进行开拆处理，结果发表后，有关反应矩阵的知识将不在保留。而且，开拆后的分布可以直接与各种理论的预言相比较，也可以与别的实验经过开拆以后的分布相比较。通常开拆的结果更为有用，因为当反应矩阵变得不可恢复时，即使对实验结果可能又有了新的理论解释，也很难进行理论检验。在粒子物理研究中，开拆法常用的领域为： ·结构函数 ●τ的谱函数（也就是强子不变质量谱） ·强子事例形状分布 ·粒子多重数分布 8

8 为什么要用开拆法一般而言，我们并不需要开拆法，例如当比较现有理论的预期值时，最好是将探测器相应叠加到理论中去。即在预期值中包含探测器效应并与未修正的原始数据相比较。但是，不将实验数据进行开拆处理，结果发表后，有关反应矩阵的知识将不在保留。而且，开拆后的分布可以直接与各种理论的预言相比较，也可以与别的实验经过开拆以后的分布相比较。 n G 通常开拆的结果更为有用，因为当反应矩阵变得不可恢复时，即使对实验结果可能又有了新的理论解释，也很难进行理论检验。在粒子物理研究中，开拆法常用的领域为： •结构函数 • τ 的谱函数 (也就是强子不变质量谱 ) •强子事例形状分布 •粒子多重数分布 •．．．

反应矩阵的逆假设立=Ri+B的逆存在：i=R(位-B) 若数据是泊松分布 V a 6 200 2000 P(n;y,)= -e n n 1000 1000 则有 l1ogL(0）=∑(n,logy,-y) 04 0608 02040.60.B i=l x102 最大似然法的估计量为 n u 2000 =n→ǜ=R(m-B) 5000 若R的非对角元太大，即区间 1000 5000 宽度比分辨率要小时，会导致上式有很大的方差，以及在相 -10000 0. 0.4 0 0.8 0 02 040.6 0.B 邻区间产生很强的负关联。 9

9 反应矩阵的逆假设的逆存在: 若数据是泊松分布 μ β 最大似然法的估计量为 ν G G G = R + ( ) 1 μ ν β G G G = − − R i i e n P n i n i i i ν ν ν − = ! ( ; ) ∑= = − N i i i i L n 1 log ( μ) ( log ν ν ) G ( ) ˆ ˆ 1 ν μ β G G G G G = = − − n R n 则有 μ ν n μˆ 若Ｒ的非对角元太大，即区间宽度比分辨率要小时，会导致上式有很大的方差，以及在相邻区间产生很强的负关联。若Ｒ的非对角元太大，即区间宽度比分辨率要小时，会导致上式有很大的方差，以及在相邻区间产生很强的负关联。？

错误的原因假设山真的有精细结构 00 的0 50 40D 应用R给出观测期待值 10 时，虽然一些结构还能 20D 00 留下，但大部分的精细结构都被抹平了。 0.25 05 0.75 200 V=R五 0.25 5 0.▣ 应用R1到V恢复精细结构：i=R 但我们没有v只有采用观测值时，由于统计涨落的缘故，有不少非物理因素造成的突起。 ◆R1"认为"这是与原来的精细结构有关，导致立=Rn有振荡效应。 10

10 错误的原因假设真的有精细结构应用 R给出观测期待值时，虽然一些结构还能留下，但大部分的精细结构都被抹平了。应用 R-1 到恢复精细结构：采用观测值时，由于统计涨落的缘故，有不少非物理因素造成的突起。 μ G μ G ν μ G G = R ν G μ ν G G −1 = R 但我们没有 ν 只有 G n G n G R-1 “认为 ”这是与原来的精细结构有关，导致 μ ˆ = R −1 n 有振荡效应。 G G

点击下载完整版文档（PDF格式）

共25页，试读已结束，阅读完整版请下载

点击下载（PDF格式）

浏览记录