第二章蒙特卡洛方法 计算机橫拟采用的方法來看,它大政可以分为两种类型 (1)隨机模拟方法或統计试验方法,又称蒙饽卡涪⑩ Monte Car1o)方法。它是遭过不斷产生随机教序列来模拟过 程。自然界中有的过程本身就是随机的过程,物理现 象中如粒子的衰变过程、粒子在介中的輸运过程.., 菁。当瘘靈特卡涪方法也可以背助慨率模型来解决不 真接具有随杋性的确定性问瘛 2)确定性棋拟方法。它是通过数值求解一个个的粒子运 动方程来棋拟蕘个系统的行为。在统计物狸中称为分 子动力学( Molecular Dynamics)方法。关于分子动 力学方法觉们将在第六章中介绍。此外,近年来还发 晨了神鲶元网络方法和原胞自动机方法。 从蒙特卡洛棋拟的应用来看。该类型的疝用可以分为三种 形式: (1)直接蒙怜卡洛模拟。它采用随机教序列来棋拟复杂 随杋过程的效应。 (2)蒙怜卡洛积分。这是利用机数序列计算积分的方 法。积分數篾高,该方法的积分效率就高。 (3) Metropolis蒙饽卡洛模拟。这神拟是以所谓“马 尔科夫”( Markov)鰱的形式产生系魷的分布序列。 该方法可以们能够研究经典和量子多粒子系 统的问题
第二章 蒙特卡洛方法 计算机模拟采用的方法来看,它大致可以分为两种类型: (1) 随机模拟方法或统计试验方法,又称蒙特卡洛(Monte Carlo)方法。它是通过不断产生随机数序列来模拟过 程。自然界中有的过程本身就是随机的过程,物理现 象中如粒子的衰变过程、粒子在介质中的输运过程... 等。当然蒙特卡洛方法也可以借助慨率模型来解决不 直接具有随机性的确定性问题。 (2) 确定性模拟方法。它是通过数值求解一个个的粒子运 动方程来模拟整个系统的行为。在统计物理中称为分 子动力学(Molecular Dynamics)方法。关于分子动 力学方法我们将在第六章中介绍。此外, 近年来还发 展了神经元网络方法和原胞自动机方法。 从蒙特卡洛模拟的应用来看,该类型的应用可以分为三种 形式: (1) 直接蒙特卡洛模拟。它采用随机数序列来模拟复杂 随机过程的效应。 (2) 蒙特卡洛积分。这是利用随机数序列计算积分的方 法。积分维数越高,该方法的积分效率就越高。 (3) Metropolis 蒙特卡洛模拟。这种模拟是以所谓“马 尔科夫”(Markov)鏈的形式产生系统的分布序列。 该方法可以使我们能够研究经典和量子多粒子系 统的问题
2.1蒙特卡洛方法的基础知识 基本恩 对求解问题本身就具有概率和鲩计性的情况,例如中子在介 厥中的传撸,被衰变过程,我们可以使用直接象卡洛模拟 方法。该方法是按照实际问题所篷循的概率计规谭,用电子 计犷杋选行真接的抽祥试验,嶽后讣算其統讣參。直接兮 卡洛模拟法最充分体親出象特卡洛方法无可拟的特殊性和优 越性,因而在物理学的各种各样问题中得到广泛的应用。该方 法也就是逦常所说的“计算机实验”。 蒙特卡洛方法也可以人为地杓遭出一个合适的概率型,依 照该模型进行大量的统计实验,使它的某些统计参量正好是恃 求问题的解。这也就是所训的间接蒙彎卡洛方法。下面们举 两个最单的例子来说明间接蒙特卡洛方法应用的内酒 巴失昂( Buffon)投针实验。 该试验方泰是:在平濞臬面上划一组相距为S的平行錢, 向此梟面随意地投掷长度l=s的细针,那末从针与平行幾相交的 概率就可以得到丌的数值。 教掌统讣理论的简单地讣算 设针与平行的軎直方向的夹角为a,那么针在与平行錢 直的方向上投影的长度为 7. cosa e。对于确定的a夹肩,细针与平 行戴相交的概率为投影长度与平行戴间距之比,即=a 由于以是在0区间均訇分布的,所以kosa的平均值为 cosa 假如在N次投针中,有M次和平行线相交。当N充分大时, 相交的频数M/N就近似为细针与平行线相交的概率。因此,我 们得到
2.1 蒙特卡洛方法的基础知识 一、 基本思想 对求解问题本身就具有概率和统计性的情况,例如中子在介 质中的传播,核衰变过程等,我们可以使用直接蒙特卡洛模拟 方法。该方法是按照实际问题所遵循的概率统计规律,用电子 计算机进行直接的抽样试验,然后计算其统计参数。直接蒙特 卡洛模拟法最充分体现出蒙特卡洛方法无可比拟的特殊性和优 越性,因而在物理学的各种各样问题中得到广泛的应用。该方 法也就是通常所说的“计算机实验”。 蒙特卡洛方法也可以人为地构造出一个合适的概率模型,依 照该模型进行大量的统计实验,使它的某些统计参量正好是待 求问题的解。这也就是所谓的间接蒙特卡洛方法。下面我们举 两个最简单的例子来说明间接蒙特卡洛方法应用的内涵。 巴夫昂(Buffon)投针实验。 该试验方案是:在平滑桌面上划一组相距为 s 的平行线, 向此桌面随意地投掷长度l = s的细针,那末从针与平行线相交的 概率就可以得到π 的数值。 数学统计理论的简单地计算: 设针与平行线的垂直方向的夹角为α,那么针在与平行线垂 直的方向上投影的长度为l ⋅ cosα 。对于确定的α夹角,细针与平 行线相交的概率为投影长度与平行线间距之比,即 α α cos cos = ⋅ s l 。 由于α 是在[0,π ]区间均匀分布的,所以 cosα 的平均值为 π α α π π 2 cos 1 0 = ∫ d . 假如在 N 次投针中,有 M 次和平行线相交。当 N 充分大时, 相交的频数M N 就近似为细针与平行线相交的概率。因此,我 们得到
2N 然而,上述批针法得到试验绪鼎的效率和拚度都很鑾 经过n次投针后得到r的肴度。 设p=2/,则针与平行相交的次数应足二项式分布, 其期望值为叩,方鑾应为m(1-p)。因而2/丌值的方鑾为 p(-p)/m,标准误差为,四-。将p=2/x的标误差改写为兀 的标凎误韁237/√n。这意咪普谜验所得的兀篁的不确定性的范 回如下: 对100次投针为,0.2374 对10,000次投针为,0.0237 对1,000,000次投针为,0.0024。 显用这种方法比用其它方法计值所引起的不确定范国要 大得多。 例:定积分讣算 f(x)x.0≤f(x)≤1 这时我们可以随机地向正方形内投成,最后统计落在曲錢下的 点数M,当总的擲点教N充分大时,M就近似于积分值I。 y=f(x)
M 2N π ≈ . 然而,上述投针法得到试验结果的效率和精度都很差。 经过 n 次投针后得到π值的精度。 设 p = 2 /π np ,则针与平行线相交的次数应满足二项式分布, 其期望值为 ,方差应为np(1− p)。因而2/π 值的方差为 p(1− p)/ n,标准误差为 ( ) n p 1− p 。将 p = 2 /π 的标准误差改写为π 的标准误差2.37 / n 。这意味着试验所得的π 值的不确定性的范 围如下: 对 100 次投针为,0.2374 对 10,000 次投针为,0.0237 对 1,000,000 次投针为,0.0024。 显然用这种方法比用其它方法计算π值所引起的不确定范围要 大得多。 例: 定积分计算 = ∫ . 1 0 I f (x)dx 0 ( ≤ f x) ≤ 1 这时我们可以随机地向正方形内投点,最后统计落在曲线下的 点数 M,当总的掷点数 N 充分大时,M N就近似等于积分值 I
蒙特卡洛方法的基本思翘 当问逦可以抽为棊个确定的教学问颋时。应当首先建立一 个恰当的概率模型,即确定某个随机事件A或随机变量X,良 得行求的解着于蘭机事件出现的概率貮随机变量的教導期望 。燚后选行拟寥验,即复多次地模拟隨机事件A或随机 变量X。最后对隨机奥验结果进行統计平均,求出A出现的频 教成Ⅹ的平均篁作为问题的近似解。这种方法也叫敵间接蒙特 卡洛拟。 二、随机变量和随机变量的分布 g <u<utd g(u)称为u的概率分布度函数,它表示随机变量u取u到 l+d之间值的概率 g()分布函数定义为 G(u)=g(kox g(u)=dG(u)/du 注宠:G(u)是一个在0区间取值的卓调邐增函数。常g(u)是 归一化的分布密度函数,因而该函数对所有的l值范國的积分 值应当为1。 三、随机变量的独立性 假如们考两个随机变量u’和ⅵ的分布,则必须引进这 两个变量的联合分布密度函数h(u1),此时带来的数学问题就更 为复杂。 在加(u;v)=p()q()这种特殊儕况下,u和v是被此独立的随 机变量。 对于个以上的变量来说,随机变量独立性的概念就更复杂 如:r和s是两个均訇分布在回区间的相互独立的随机变 量,由此我们可以构遭三个新的变量
蒙特卡洛方法的基本思想: 当问题可以抽象为某个确定的数学问题时,应当首先建立一 个恰当的概率模型,即确定某个随机事件 A 或随机变量 X,使 得待求的解等于随机事件出现的概率或随机变量的数学期望 值。然后进行模拟实验,即重复多次地模拟随机事件 A 或随机 变量 X。最后对随机实验结果进行统计平均,求出 A 出现的频 数或 X 的平均值作为问题的近似解。这种方法也叫做间接蒙特 卡洛模拟。 二、 随机变量和随机变量的分布 g( ) u du = P[ ] u < u′ < u + du . g(u) u + 称为 u 的概率分布密度函数,它表示随机变量 u’取 u 到 du之间值的概率。 g(u) 分布函数定义为: G( ) u g( ) x dx . u ∫−∞ = 则 g( ) u = dG( ) u / du . 注意:G(u)是一个在[0,1]区间取值的单调递增函数。通常g(u)是 归一化的分布密度函数,因而该函数对所有的 值范围的积分 值应当为 1。 u 三、 随机变量的独立性 假如我们考虑两个随机变量 u’和 v’的分布,则必须引进这 两个变量的联合分布密度函数h(u,v),此时带来的数学问题就更 为复杂。 在 这种特殊情况下,u’和 v’是彼此独立的随 机变量。 h( ) u,v = p(u)⋅ q(v) 对于两个以上的变量来说,随机变量独立性的概念就更复杂 了。 如: r 和 s 是两个均匀分布在[0,1]区间的相互独立的随机变 量,由此我们可以构造三个新的变量
=(r+s)mod 1 此时xy,也都是均訇分布在区间國]的随机变量,并且所有的 (xy)U=)和(x,z)组合都是独立的(括号内任一个变量值的选取 并不对括号中另一个变量的取值有影响)。但是(x,y2)中,任 意两个变量的篁可以确定出第三个变量的值。此时它们之间存 在明显的相共性 四、期值、方鑾和协方 个函数/)的数学期望值是定义为该函数的平均值 Ef)=f(uku 类似地,可以定义变量l'的期望值为u的平均值 Elu)=udG()=ug(ubu 个函教成变量的方塾 VU=EU-EUDU-EU] 方的平方根叫做祿准误。由于祿准误差与其真值有相同 的量鋼,因而它比方塾更具有物理危义 如果将求期望值和求方塾的运犷作为犷符,我们可以证明出 这些算符作用在随机交量的纜性组合式上的一些筒阜则。假 如x和y是随机变量,C是一个常薮,则 Ecx+y=cEx)+Ell V(cx+y)=cvx)+vl)+2cEy-El(x-E() 期望寶算是一个錢性算,而方鑾算普是非能性算待。 五、大数法则和中心极限定理 概率论中的大数法则和中心极限定理是蒙特卡洛方法的基础
( )mod1. , , z r s y s x r = + = = 此时 x y, ,z 也都是均匀分布在区间[0,1]的随机变量,并且所有的 和 组合都是独立的(括号内任一个变量值的选取 并不对括号中另一个变量的取值有影响)。但是( )中,任 意两个变量的值可以确定出第三个变量的值。此时它们之间存 在明显的相关性。 ( ) x, y ,(y,z) (x,z) x y, ,z 四、 期望值、方差和协方差 一个函数 f (u′)的数学期望值是定义为该函数的平均值 E{f } f ( ) u dG( ) u f (u)g(u)du ∫ ∫ = = . { } f ( ) u du b a E f b − ∫a = 1 . 类似地,可以定义变量u′的期望值为u的平均值 E{u } ( udG u) ug(u)du ∫ ∫ ′ = = . 一个函数或变量的方差: V{ }f E{ } ( ) f E{f } [f E{ }f ] dG 2 2 ∫ = − = − . 方差的平方根叫做标准误差。由于标准误差与其真值有相同 的量纲,因而它比方差更具有物理意义。 如果将求期望值和求方差的运算作为算符,我们可以证明出 这些算符作用在随机变量的线性组合式上的一些简单规则。假 如 x 和 y 是随机变量,c 是一个常数,则 E{ } cx + y = cE{x}+ E{y}. { } cx + y = c V{x}+V{y}+ 2cE{(y − E{y})(x − E{x})} 2 V . 期望值算符是一个线性算符,而方差算符是非线性算符。 五、 大数法则和中心极限定理 概率论中的大数法则和中心极限定理是蒙特卡洛方法的基础
大数法则反映了大量随机数之和的性质。 如果函数h在[区间,以均訇的概率分布密度隨机地取n 个数l,对每个u计算出函数值H(u)。大教法则告诉我们这些 函数值之和除以n所得的值将收敛于函数h的期望值,即 lim -h(u)=lim I h(udu= I 大教法则佩证了在抽取足够多的随机样本后,计算得到的积 分的兮卡涪佔计值将收筮于该积分的正确绪果。考要对收敛 的程度选行研兇。并做出各种误差佑讣,则要用到中心极限定 中心极限定理告诉我们:在冇足够大,但又有限的抽样教n 的情沉下,蒙兮卡洛佔计是如何分布的。 该定理指出:无论随机变量的分布如何,它的若干个独立随 机变量抽榉值之和总是满足正则分布(即高斯分布)。例如我们 有一个随机变量,它演足分布密度函数f(x)。如果我们将n个 满足分布鲁度函数f(x)的独立随机数相加:R=7+n2+…+mn, 则R灡足高斯分布。高斯分布可以由给定的期望值μ和方a2完 全确定下来,邋常用N(x,a2)来襄示 N(,a2)= ex /2σ 中心极限定理可以给出蒙特卡洛佔计值的傭。如上面公弌 右边积分的期望值为Ⅰ。公弌左边用n次抽样的象卡洛佑计 为ln,标准误鑾为σ,则当n充分大时,对任意的λ(λ>0),有 O lim Pr ob-2 ≤ln-1<A e-7/2dt=1-a 这说明:该积分的期望值与求钞卡洛佔计值之塾在范国 <1 内的概率为1-a,a称为显着水平,1-a称为量信水平。σ为 蒙特卡洛估计值的标准误差,σ2=V{}/n。a与λ的关系可以有 上面积分公式泶得。也有专冂的教学用衰可査。例如取量信水 平1-a=9,可以查2=3。这可以解释为:不式-小<3
大数法则反映了大量随机数之和的性质。 如果函数 在[ 区间,以均匀的概率分布密度随机地取 n 个数 ,对每个 计算出函数值 h a,b] ui ui ( ) h ui 。大数法则告诉我们这些 函数值之和除以 n 所得的值将收敛于函数h的期望值,即 ( ) ( ) 1 1 1 lim lim n b i n n n a i h u I h u du I →∞ n b = →∞ a ≡ = − ∑ ∫ ≡ . 大数法则保证了在抽取足够多的随机样本后,计算得到的积 分的蒙特卡洛估计值将收敛于该积分的正确结果。若要对收敛 的程度进行研究,并做出各种误差估计,则要用到中心极限定 理。 中心极限定理告诉我们:在有足够大,但又有限的抽样数 n 的情况下,蒙特卡洛估计值是如何分布的。 该定理指出:无论随机变量的分布如何,它的若干个独立随 机变量抽样值之和总是满足正则分布(即高斯分布)。例如我们 有一个随机变量η ,它满足分布密度函数 f (x)。如果我们将 个 满足分布密度函数 n f (x) 的独立随机数相加: 1 2 ... Rn n =η + + η η+ , 则Rn满足高斯分布。高斯分布可以由给定的期望值µ和方差 完 全确定下来,通常用 2 σ ( ) 2 N µ,σ 来表示 ( ) ( )2 2 2 1 , exp 2 N x µ σ µ / 2 σ π = − − σ . 中心极限定理可以给出蒙特卡洛估计值的偏差。如果上面公式 右边积分的期望值为 ,公式左边用 n 次抽样的蒙特卡洛估计 值为 ,标准误差为 I n I σ ,则当 n 充分大时,对任意的λ(λ > 0),有 ( ) ( ) 2 1 / 2 limPr 1 2 t n n f f ob I I e dt n n λ λ σ σ λ λ α π − →∞ − − ≤ − < = = − ∫ . 这说明:该积分的期望值与蒙特卡洛估计值之差在范围 ( ) n f I I n σ − < λ 内的概率为1−α ,α 称为显著水平,1−α 称为置信水平。σ 为 蒙特卡洛估计值的标准误差, V{f }/ n 2 σ = 。α 与λ 的关系可以有 上面积分公式求得。也有专门的数学用表可查。例如取置信水 平1−α = 99%,可以查得λ = 3。这可以解释为:不等式 − < 3 n I I n σ
成立的概率为99%同样1-a=95%时,λ=2。 从上面的分析看到,蒙特卡洛方法的误鎏与σ2和n有关。为 熾小误塾。就庇過选取量优的隨机变量,使其方塾最小。对 同一个问题,往往会有多个可供选择的随机变量,这时就应当 择优而用之。在方鑾固定时,增加模拟次教可以有效地魂小误 姜。如谜验次数增加100簡,度提高10。当这禅儆就增 加了计算的机时,提高了用。所以在考虎默特卡洛方法的精 确度旳。不能只是簡阜地微少方塾和增加模拟次教。还同时 兼顾计算费用,即机时耗费。常以方基和费用的乘积作为衡 量方法优劣的标准
成立的概率为99%。同样1−α = 95%时,λ = 2。 从上面的分析看到,蒙特卡洛方法的误差与 和 n 有关。为 了减小误差,就应当选取最优的随机变量,使其方差最小。对 同一个问题,往往会有多个可供选择的随机变量,这时就应当 择优而用之。在方差固定时,增加模拟次数可以有效地减小误 差。如试验次数增加 100 倍,精度提高 10 倍。当然这样做就增 加了计算的机时,提高了费用。所以在考虑蒙特卡洛方法的精 确度时,不能只是简单地减少方差和增加模拟次数,还要同时 兼顾计算费用,即机时耗费。通常以方差和费用的乘积作为衡 量方法优劣的标准。 2 σ