粒子物理与核物理实验中的 数据分析 陈少敏 清华大学 第十二讲:开拆法
粒子物理与核物理实验中的 数据分析 陈少敏 清华大学 第十二讲:开拆法
本讲要点 数学公式,反应函数(矩阵) 求反应矩阵的逆 修正因子 ·正规化的开拆法 a)Tikhonov规则 b)MaxEnt规则 ·估计量的方差与偏置 ·正规化参数的选择 举例 2
2 本讲要点 数学公式,反应函数(矩阵) 求反应矩阵的逆 修正因子 正规化的开拆法 估计量的方差与偏置 正规化参数的选择 举例 a) Tikhonov 规则 b) MaxEnt 规则
图像还原问题 个常见的问题:由于实验仪器的原因而出现图像变形,例如 10000 30000 10000 8000 25000 8000 20000 6000 6000 15000 4000 4000 10000 2000 2000 5000 aae1e4+1414a1e411t。4 4LL4LLL上L44L -1 -0.5 00.51152 -1080.6040200.20.40.60.81 1 0500.5 1152 真实分布 如果,已知 通过探测器模拟可以 实验观测分布 给出其影响的形式 能否还原出不受实 验仪器影响的分布? → Unfolding(开拆法) 3
3 图像还原问题 ⊗ = 一个常见的问题:由于实验仪器的原因而出现图像变形,例如 如果,已知 通过探测器模拟可以 给出其影响的形式 实验观测分布 能否还原出不受实 验仪器影响的分布? 能否还原出不受实 验仪器影响的分布? Unfolding(开拆法 ) 真实分布
开拆问题的表述 考虑有随机变量y,我们的目标是要找到概率密度函数f(y) 如果函数可参数化为f(y,O),那么确定概率密度函数,等效于 最大似然法 若无参数化形式,可通过构造直方图 80 P,=lin f(ydy )j=1,,M 60 4=4oP,☐"真实的直方图" 40 目标:为4,(或p)构造估计量 20 参数的数日=区间的数目M 问题:y在测量时不可能没有误差 各区间之间填入的数目互 bin j 串,导致f(y)散开变宽。 4
4 开拆问题的表述 考虑有随机变量 ,我们的目标是要找到概率密度函数 如果函数可参数化为 ,那么确定概率密度函数,等效于 若无参数化形式,可通过构造直方图 y f ( y ) ( ;θ ) G f y 最大似然法 θ ˆ G bin ( ) 1,..., j j j t ot j p f y dy j M μ μ p = = = ∫ “真实的直方图 ” 目标: 为 μ j ( 或 p j )构造估计量 问题: y 在测量时不可能没有误差 参数的数目 =区间的数目 M () f y 各区间之间填入的数目互 串,导致 散开变宽
反应矩阵 测量误差的影响:y=真值; X= 观测值 fmeas(x)=R(xIy)fre(y)dy 反应矩阵 观测直方图 写成离散形式 (期待值) M i=1,,N R=P(观测值在第i区|真实值在第j区) 真实直方图 数据:n=(n12,nw) 400 400 这里Y:=E[n] 200 200 注意:d,是常数,n会受 到统计涨落的影响。 0 0.250.50.75 0.25 0.5 0.75 5
5 反应矩阵 测量误差的影响: 数据: y = 真值; x = 观测值 ∫ f x = R x y f y dy meas true ( ) ( | ) ( ) 写成离散形式 R i N M j i ij j , 1,..., 1 = ∑ = = ν μ 观测直方图 (期待值) 反应矩阵 真实直方图 ( | ) R P ij = 观测值在第 i 区 真实值在第 j 区 [ ] ( ,..., ) 1 i i N E n n n n = = ν G 这里 注意: 是常数, 会受 到统计涨落的影响。 μ ν G G , n G
效率,本底 有时侯,事例可能会不被探测到 立R,=立P(观测值在第i区真实值在第/区 i=l P(观测值在全范围!真实值在第区) =6,(效率) 取决于在第j区的真实直方图 有时在无真实事例发生的 400 时候,也有事例被观测到 M 0.5 =∑R,4+B i=1 0 00.250.50.75 0 0.25 0.5 0.75 B是在观测直方图上预 期的本底数目,并假设它是已知的。 6
6 效率,本底 有时侯,事例可能会不被探测到 是在观测直方图上预 期的本底数目,并假设它是已知的。 有时在无真实事例发生的 时候,也有事例被观测到 1 1 ( | ) ( | ( ) N N ij i i j R P i j P j ε = = = = = ∑ ∑ 观测值在第 区 真实值在第 区 观测值在全范围 真实值在第 区) 效率 ∑= = + M j i Rij j i 1 ν μ β βi 取决于在第 j 区的真实直方图
各关键量总汇 M 真实"直方图:=(4,,4M) 4o=∑4 M个区间 i=1 概率:p=(P1,pM)=i/4o 观测直方图的期待值:=(y1,,VN) N个区间 观测直方图:n=(n,,nw) 反应矩阵:R=P(观测值在第i区|真实值在第j区) 效率:6,=∑R 预期的本底:B=(B,Bx) i= ETn]==Rii+B 为了找到u的估计量,需要相关的概率理论,例如:P(,;y) 上 n 泊松分布,或关联矩阵V,=Cov[n,n,]以便构造logL或X
7 各关键量总汇 “真实 ”直方图: 观测直方图的期待值: 反应矩阵: 效率: ∑= = = M j M tot j 1 1 μ ( μ ,..., μ ), μ μ 概率: 观测直方图: G M tot p ( p1,..., p ) μ / μ G G = = ( ,..., ) ν = ν 1 ν N G ( ,..., ) 1 N n = n n G ( | ) R P ij = 观测值在第 i 区 真实值在第 j 区 ∑= = N i j Rij 1 ε ( ,..., ) 预期的本底: β = β1 β N G ν μ β G G G G E [ n ] = = R + 为了找到 的估计量,需要相关的概率理论,例如: i i e n P n i n i i i ν ν ν − = ! ( ; ) 泊松分布,或关联矩阵 Vij = cov[ ni , n j ] 以便构造 2 log L 或 χ μ G M个区间 N个区间
为什么要用开拆法 般而言,我们并不需要开拆法,例如当比较现有理论的预期值时,最好 是将探测器相应叠加到理论中去。即在预期值中包含探测器效应并与未修 正的原始数据n相比较。 但是,不将实验数据进行开拆处理,结果发表后,有关反应矩阵的知识将 不在保留。而且,开拆后的分布可以直接与各种理论的预言相比较,也可 以与别的实验经过开拆以后的分布相比较。 通常开拆的结果更为有用,因为当反应矩阵变得不可恢复时,即使对实验 结果可能又有了新的理论解释,也很难进行理论检验。 在粒子物理研究中,开拆法常用的领域为: ·结构函数 ●τ的谱函数(也就是强子不变质量谱) ·强子事例形状分布 ·粒子多重数分布 8
8 为什么要用开拆法 一般而言,我们并不需要开拆法,例如当比较现有理论的预期值时,最好 是将探测器相应叠加到理论中去。即在预期值中包含探测器效应并与未修 正的原始数据 相比较。 但是,不将实验数据进行开拆处理,结果发表后,有关反应矩阵的知识将 不在保留。而且,开拆后的分布可以直接与各种理论的预言相比较,也可 以与别的实验经过开拆以后的分布相比较。 n G 通常开拆的结果更为有用,因为当反应矩阵变得不可恢复时,即使对实验 结果可能又有了新的理论解释,也很难进行理论检验。 在粒子物理研究中,开拆法常用的领域为: •结构函数 • τ 的谱函数 (也就是强子不变质量谱 ) •强子事例形状分布 •粒子多重数分布 •...
反应矩阵的逆 假设 立=Ri+B的逆存在:i=R(位-B) 若数据是泊松分布 V a 6 200 2000 P(n;y,)= -e n n 1000 1000 则有 l1ogL(0)=∑(n,logy,-y) 04 0608 02040.60.B i=l x102 最大似然法的估计量为 n u 2000 =n→ǜ=R(m-B) 5000 若R的非对角元太大,即区间 1000 5000 宽度比分辨率要小时,会导致 上式有很大的方差,以及在相 -10000 0. 0.4 0 0.8 0 02 040.6 0.B 邻区间产生很强的负关联。 9
9 反应矩阵的逆 假设 的逆存在: 若数据是泊松分布 μ β 最大似然法的估计量为 ν G G G = R + ( ) 1 μ ν β G G G = − − R i i e n P n i n i i i ν ν ν − = ! ( ; ) ∑= = − N i i i i L n 1 log ( μ) ( log ν ν ) G ( ) ˆ ˆ 1 ν μ β G G G G G = = − − n R n 则有 μ ν n μˆ 若R的非对角元太大,即区间 宽度比分辨率要小时,会导致 上式有很大的方差,以及在相 邻区间产生很强的负关联。 若R的非对角元太大,即区间 宽度比分辨率要小时,会导致 上式有很大的方差,以及在相 邻区间产生很强的负关联。 ?
错误的原因 假设山真的有精细结构 00 的0 50 40D 应用R给出观测期待值 10 时,虽然一些结构还能 20D 00 留下,但大部分的精细 结构都被抹平了。 0.25 05 0.75 200 V=R五 0.25 5 0.▣ 应用R1到V恢复精细结构:i=R 但我们没有v只有 采用观测值时,由于统计涨落的缘故,有不少非物理因素造成的突起。 ◆R1"认为"这是与原来的精细结构有关,导致立=Rn有振荡效应。 10
10 错误的原因 假设 真的有精细结构 应用 R给出观测期待值 时,虽然一些结构还能 留下,但大部分的精细 结构都被抹平了。 应用 R-1 到 恢复精细结构: 采用观测值时,由于统计涨落的缘故, 有不少非物理因素造成的突起。 μ G μ G ν μ G G = R ν G μ ν G G −1 = R 但我们没有 ν 只有 G n G n G R-1 “认为 ”这是与原来的精细结构有关,导致 μ ˆ = R −1 n 有振荡效应。 G G