
1 第一章 微观可逆性和宏观不可逆性 §1.1 统计物理学的任务 在本书的上册中我们讨论了热学理论中的热力学和气体动理论两部分内容,它们都是研 究与物质的热运动有关的宏观性质。热力学是宏观理论,它是以在热学中观测到的大量的 实验事实归纳出的几条基本规律为基础,引进了系统的宏观热力学量,如温度、压强、内 能和熵等等,它与物质的分子观念无关。与热力学不同,统计物理学和作为它的原型的气 体动理论是从物质的原子或分子结构和原子世界的基本动力学原理出发,并与概率论相结 合,它的理论体系是建立在哈密顿力学原理和数理统计的基础之上,将我们从微观物理世 界引导到宏观物理世界,它要回答诸如在热力学定律背后的微观规律是什么,如何从这些 规律去解释热力学定律,以及为什么一个特定的物理系统会显示出这种热力学性质等问 题。本书的下册将学习统计物理学的研究方法和如何应用统计物理去处理实际的物理问 题。 统计物理学是从物质的原子或分子结构和粒子的微观运动规律来阐明物质宏观性质的科 学,它的基本出发点是: 1.宏观物质是由大量的原子、分子、电子和光子等微观粒子所组成的; 2.微观粒子的运动服从力学规律。从本质上说,微观粒子的运动服从量子力学规律, 然而,在一定的条件下可以用经典力学作近似处理; 3.认为系统以一定的概率出现在各个微观状态上,运用概率论和力学规律可求出各个 微观量的统计平均值,这个平均值就是与此微观量相应的宏观量。 众所周知,宏观物体所包含的粒子数十分巨大,例如在标准状况下, 3 1cm 的气体就有个 数为 10 19 量级的分子,系统的宏观热力学性质显然与大量分子的运动状态有关。那么我们 是否可以通过求解包含在物质中的所有粒子的力学运动方程来求得系统的宏观性质呢?回 答是否定的。这一方面由于大量的分子在物质中的运动是极其复杂的,我们不可能求解如 此巨大数目粒子的薛定谔方程或牛顿方程,实验上也无法确切地给出每个粒子的初始状 态;另一方面,我们知道,微观粒子运动的力学规律是时间可逆的,而宏观热现象则是不 可逆的;组成宏观物体的大量粒子的运动是极其复杂的,而经验和实验都告诉我们宏观物 体的热性质却遵循确定而简单的规律。因此,系统的宏观热力学性质与组成它的大量粒子 的运动状态有关,但又不是粒子运动的简单的叠加。宏观系统由于大量微观粒子的出现将 导致一种在性质上全新的规律性——统计规律性。统计规律性是以系统存在大量粒子为先 决条件,当把它应用到粒子数不多的力学系统时,它便失去了任何意义。具有大量粒子的 系统的运动与粒子数不多的系统的运动遵循同样的力学规律,然而对于大量粒子组成的宏 观物体,由于有大量的自由度存在,将导致统计规律性的出现。物体的宏观性质是不能仅 靠具有时间可逆的力学规律得到的,只有将力学规律性和统计规律性相结合才能解释宏观 物体的性质和热力学过程的不可逆性。为了说明统计规律性出现的必然性,我们将引人最 小尺度概念,并讨论它与运动规律之间的关系。 1.最小尺度和运动规律 每门学科都有一个它所对应的(或可分辨的)最小空间尺度和最小时间尺度,最小尺 度不同,描述运动规律也不同,所得到的结论也会不同。例如,肉眼能分辨的最小空间尺 度约为 10 −3 cm,光学显微镜能分辨的最小空间尺度约为 10 −5 cm,而电子显微镜能分辨的

2 最小空间尺度为 7 8 10 10 cm cm − − − 。因此,在肉眼看来十分平整的铁片,在显微镜下会看 出它的凹凸不平,而在电子显微镜下,或者通过 X 射线衍射,则能探测到它的空间点阵结 构。 同样,测量时间也有最小尺度,例如人的视觉能分辨的最小尺度为 0.05 秒,所以由于 人的视觉的残留,对于以每秒 24 幅放映的电影看到的已不再是 24 幅分离的画面,而是一 幅连续的活动画面了。 在物理学中每门学科都有各自的最小尺度。例如,在原子物理学中,空间的最小尺度应 大于原子核的直径,时间的最小尺度应大于 0 a ,式中 0 a 为原子的玻尔半径,v 是原子中 电子运动速度。因此在原子物理学中,我们不再考虑原子核的内部结构,而把原子核看成 带有 Ze 正电荷的有一定质量和核自旋的粒子,有 Z 个质量为 m e 、电荷为−e 和自旋 2 1 ħ 的电子绕原子核运动,其运动规律服从薛定谔方程。 如果我们把最小空间尺度扩大到远大于分子之间的平均距离,最小时间尺度扩大到远大 于分子的平均碰撞时间,则气体和液体就可以看成连续介质,它们的运动服从流体力学规 律,而原子分子的性质反映在粘滞系数和扩散系数等物理量上了,这些量并不反映单个粒 子运动的特性,而是反映大量粒子在宏观小微观大的测量区域内和在宏观短微观长的观测 时间内运动的平均效果,也即反映了物质的宏观性质。 因此,每门学科都在各自的最小时间和空间尺度下描述物质的运动,总结出各门学科的 运动规律。最小尺度改变了,描述物质运动的规律也应随着改变。 2.统计物理的最小尺度 统计物理学描述宏观物体的热运动规律,它的最小空间尺度应远大于分子的直径,它的最 小时间尺度应远大于分子的平均碰撞时间。在这一尺度的体积内包含有大量的分子,在这一 时间尺度内分子的运动状态已经发生了各种各样的变化。因此,从微观上看统计物理的最小 时空尺度是大的,但从宏观上看,它们又是足够小,小于宏观性质时空变化的特征尺度,因 此,能够反映宏观性质随时间和空间的变化。实际测量的宏观量是相应的微观量在这种宏观 小、微观大的时空尺度范围内的平均值,它们并不需要知道每一个分子的确切的运动状态。 例如,在麦克斯韦速度分布率中,我们关心的只是在宏观小、微观大的速度间隔内的平均分 子数,而并不要求确切知道每个分子的速度究竟是多少。正如麦克斯韦(Maxwell)在“热 学理论”(1897 年)一书中所指出的:“这里我想指出,采用这种统计方法,只考虑按速度挑 选的各群分子的平均数,我们就放弃了那种严格的动力学方法,并不去追踪每一个分子在其 整个旅程中的确切运动情况。因此有这样的可能,我们会得出一些结果,只要假设研究的是 大量气体,这些结果尽管完全能描述气体的实际情况,但是假如我们的官能和仪器变得如此 敏锐,以致能够觉察和控制每一个分子,并能在发展进程中跟踪它,这些结果就会不再有用。” 下面以气体的密度 (r,t) 和压强 p(r,t) 为例说明之。 (1)气体密度 (r,t) 按定义在体积 ΔV 内气体的平均密度为 ( ) ( , ) , ( , ) m N r t r t mn r t V = = 式中m为分子质量, N r t ( , ) 为位置在 r 到 r +Δ r 的体积∆V内的平均分子数。当

3 = V x y z 越来越小,立方体的边长 x 比原子的直径还要小时,例如 12 x m 10− , 则有的点测得的密度 很大,有的点测得的密度 很小,甚至为零,没有确定的值,这时 密度 就没有意义了。因此,求密度时 ΔV→0并不是数学上的零,而是在一个微观大的 体积 ΔV 内求密度的平均值,Δx应远大于分子的直径,ΔV 内包含很多分子。另一方面 Δ x在宏观上又应足够小,小于测量仪器的空间分辨尺度,以显示密度随位置的变化。如果 要测量的密度不均匀性的特征长度为 ,则可以取 0 a x ,式中 0 a 为氢原子的玻 尔半径。这就是说 x 和 ΔV 都应该取宏观小,微观大的量。 (r t, ) 是气体在这种微观 大、宏观小的体积 ΔV 内的局域平均密度。 气体密度 ρ 也可以是时间的函数,由于气体分子不停地运动和碰撞, V 内分子进进出 出,分子数随时间不断变化,通常测量得到的 ρ 是对一段时间 Δt 的平均值,从微观上看这 段时间必须足够长,以便使粒子数密度 n 的平均值具有稳定的数值;但在宏观上看 Δt 又要 足够短,它应小于测量仪器的时间分辨尺度,这样才能显示出密度随时间的变化。如果要 测量的气体密度随时间变化的宏观特征时间为 T,则 Δt 可以取为 t T ,式中 为 分子的平均碰撞时间。 那么这种宏观小,微观大的时间空间尺度内求气体密度的平均值是否能在实验中实现 呢?答案是肯定的。在标准状况下,气体的分子数密度 19 3 n cm 2.7 10 − = 。如果密度的空 间不均匀性的特征长度 2 10 cm − = ,则取 3 x cm 10− = ,在 9 3 V cm 10− = 的立方体内仍 含有 10 2.7 10 个分子。从宏观上看 V 很小,但从微观上看 ΔV 很大,其中包含有大量 的分子。气体密度正是这种意义下的平均密度 m N V 。其次,在1 3 cm 体积内的分子在 1秒内相互碰撞次数约为 29 1 10 − s 。如果密度时间不均匀性的时间尺度 2 T s 10− = ,则取 3 t s 10− = ,这在宏观看来是足够短了,但在这段时间内,在 9 3 V cm 10− = 体积内,分 子发生了 17 10 次碰撞,测量得到的是大量分子经过频繁的碰撞后的平均密度。可见在统计 物理的最小尺度范围内求平均密度能够在实验中实现。 (2)压强 p 按照分子动理论,在 Δt 时间内碰到面积为 ΔA 器壁上的分子传给器壁的动量为 nf v mv v t Adv ( ) 2 cos cos 其中 v 为分子的速度,θ 为速度 v 和 ΔA 的法线方向之间的夹角。因此,气体对器壁的压 强 2 2 p mn f v v dv = 2 ( ) cos (1.1.1) 这里的 ΔA 应为一个宏观小微观大的面积元,而 Δt 应为宏观短微观长的时间间隔,如 在上述的例子中,取 6 2 3 A cm t s 10 , 10 − − = = ,则在 Δt 时间内约有 14 10 个气体分子碰到

4 ΔA 面积上,从气压计上测出的是在这段时间内和在这一面积上的平均压强。 从上面的讨论可以得到,宏观系统包含有大量的原子分子,这些粒子的运动服从力学 规律,它们的运动在微观上是可逆的,但是宏观仪器测量不到单个粒子在微观短时间内的 行为,而只能观察到许多粒子在微观长的时间内的平均性质。宏观物体的热力学性质是大 量分子在观测时间内的平均值,正是这种平均抹平了在最小时空尺度范围内的粒子运动的 所有信息。因此,宏观的热现象不再是可逆的了。最小尺度的观点把微观尺度上的可逆性 和宏观尺度上的不可逆性统一起来了。 任何宏观量的测量都是在宏观短而微观长的时间内进行的,测量得到的是时间平均值。 在统计物理中的宏观量是与宏观量相应的微观量对所有可能的微观运动状态的统计平均 值,在含义上与时间平均值并不完全相同。然而由于每一次的测量都是在微观长的时间内 进行的,在测量的时间内,系统的微观状态已经发生了千变万化,所以,每一次测量的结 果几乎等于对一切可能的微观状态的统计平均值。 §1.2 宏观状态和微观状态 考虑装在一个容器中 N 个可以分辨的分子所组成的理想气体,除碰撞瞬间外,分子之间 的相互作用可以忽略不计,分子作自由运动。现在我们把注意力集中在分子的位置以及它们 的空间分布上,假设用一个假想的隔板将容器分隔成体积相等的两部分,以 n 表示左半容 器的分子数,以 n 表示右半容器的分子数,则有 n n N + = 如果系统处于平衡态,N 又很大,则通常我们会发现 n n ,但这只是近似相等,因为由 于分子的运动和分子之间以及分子与器壁之间的不断碰撞,分子不断改变着它们的位置和 速度。在统计物理中可以用两种方法来描述系统的状态:一种是着眼于分布在左右两边容 器中的分子数,用来描述系统的每一种分布 (n n, ) 称为系统的宏观状态;另一种是确定每 一个分子在左边或在右边容器,它描述了每个分子在容器两边的一种特定的分配方式,每 一种分配方式称为系统的微观状态。通常一个分布可以包含很多个不同的微观状态。在无 外场时,理想气体分子的运动不受其他分子的影响,容器中每个分子可能在左边,也可能 在右边,处于容器左边和右边的概率相等。每个分子有两种分配方式,N 个分子共有 2 N 种分配方式,也即有 2 N 种微观状态,但系统的分布却只有(N,0),(N-1,1), .,(0,N)共 N+1 种,分布(n,N-n)包含有 n CN 个不同的微观状态。令 W(n,N-n)为分布(n,N-n)所包 含的微观状态数,则, ( ) ( ) ! , ! ! n N N W n N n C n N n − = = − (1.2.1) 例如,当 N=4 时,4 个分子的各种可能的分布和它所包含的微观状态数列表如下: 分布 (4,0) (3,1) (2,2) (1,3) (0,4)

5 微观状态数 W 1 4 6 4 1 我们看到当 n=N/2=2 时,这一分布所包含的微观状态数最大,为 6,也即在 n=N/2 时, W N N ( 2, 2) 有一个极大值,这个极大值随着 N 的增加急剧增大。当 N 23 10 时,分布 n=N/2 的宏观状态所包含的微观状态数 W N N ( 2, 2) 有一个极其尖锐的极大值,当 n 稍 微偏离 N/2 时,W(n,N-n)就急剧减小,以致和极大值 W(N/2,N/2)相比完全可以忽略。 现将上面的讨论作一推广,将容器 V 分成体积相等的 s 个小室,N 个气体分子将占据 这 s 个小室,每个小室的体积为 v v V V , s = ,但每个小室 v 中仍有很多分子。设某种分 布为在 1 v 中有 1 n 个分子,在 2 v 中有 2 n 个分子, ,在 s v 中有 s n 个分子,显然分布 (n n n 1 2 , , , s ) 应满足条件 1 s i i n N = = (1.2.2) 分布 (n n n 1 2 , , , s ) 描述了系统的一种宏观分布,这种分布所包含的微观状态数为 ( ) 1 2 , , , 1 2 1 ! , , , s n n n s N s i i N W n n n C n = = = (1.2.3) 当 N 很大时,W 在 1 2 s n n n N s = = = = 处有一个极其尖锐的极大值,其它分布的 W 值 和它相比可以忽略不计。 一般说来,要确定系统的宏观态通常只需要测定少数几个宏观量,例如温度、压强、密 度等。然而从力学观点来看,由大量的原子或分子组成的系统,有巨大的自由度,可以通过 尽可能精确地指定系统的动力学量来定义系统微观态,因此,微观态是大量的。 在经典统计物理中,对于一个有 f 个自由度的系统,它有 f 个广义坐标 (q q q 1 2 , , , f ) 和 f 个 与 i q 共轭的广义动量 ( p p p 1 2 , , , f ) , 平 衡系 统 的微 观 态可 以 通过指定 (q q q p p p 1 2 1 2 , , , , , , , f f ) 的一组值来确定。因此,经典统计物理中的微观态的集合是系 统在 2 f 维相空间中的连续的点集。 在量子统计物理中,平衡系统的微观态由薛定谔方程 H E l l l = (1.2.4) 所确定的波函数 l 来描写,El 为系统的能量, l 为描述系统状态的量子数, H 是系统的哈 密顿算符。因此,在量子统计物理中的微观态的集合就是量子数 l (或一组量子数)所表示

6 的量子态 l 的可数集。 当系统处于平衡态时,系统的宏观量不随时间变化。然而,从微观上看,系统的分子从 来没有停止过运动,人们无法精确地说出系统究竟处于哪一个微观态。在求系统的宏观性质 时,我们不可能,也不必要知道粒子微观状态的复杂的变化,只要知道各个微观态出现的概 率,就可以用统计的方法来求出微观量的统计平均值。 §1.3 统计假设 确定各个微观态出现的概率是统计物理的根本问题,它由玻尔兹曼(Boltzmann)在 19 世纪 70 年代提出的等概率原理而得以解决。等概率原理认为,对于处于热力学平衡态的 孤立系统,系统的各个可能的微观状态出现的概率相等。 等概率原理认为处于热力学平衡态的孤立系统中的各个微观状态是平权的,它和粒子微 观运动的可逆性是相容的。既然所有可能的微观状态都满足同样的宏观条件,而且也没有任 何理由认为其中哪一个微观状态出现的概率应当更大一些或更小一些,因此,认为系统每个 可能的微观状态出现的概率相等是一个自然而合理的假设。等概率原理是统计物理中的一个 基本假设,它的正确性由它所得到的各种推论和实验事实相一致而得到充分的证明。等概率 原理确定了孤立系统平衡态的分布函数。 在上一节中装有 N 个理想气体分子的容器,被假想的隔板分成体积相等的两部分的例子 中,系统的微观状态总数为 2 N ,由等概率原理得到出现分布为(n,N-n)的概率为 ( ) 1 1 ! ( , ) ( , ) 2 2 ! ! N N N p n N n W n N n n N n − = − = − (1.3.1) p n N n ( , ) − 是归一化的, 0 ( , ) 1 N n p n N n = − = 。 当 N 很大时,W(n,N-n)在 n=N/2 处有一个尖锐的极大,也即分布(N/2,N/2)具有最大的微 观状态数。所以,分布(N/2,N/2)称为最概然分布,对于 N 很大的宏观系统, n 和 2 N 稍有偏 离的其它分布的微观状态数,与最概然分布相比几乎可以忽略不计。由等概率原理可知 p n N n ( , − ) 与 W n N n ( , − ) 成正比,因此,有时称 W 为热力学概率。n 偏离 N/2 的状态可 能出现,但它出现的概率非常小,小到宏观上几乎观察不到,实际观察到的状态是分布概率 最大的宏观状态,即 N 个分子均匀地分布在左右两边容器内,这正是系统处于平衡态时的 宏观状态。玻尔兹曼认为,由于涨落等因素的存在,不可能找到一个把一切可能的微观状态 都包含进去的分布,但假如一个分布所包含的微观状态数远大于其他分布的微观状态数,可 以认为这个最概然分布所对应的宏观状态就是平衡态,其他分布的宏观状态不是绝对地不出 现,但出现的概率极小,可以忽略不计。由此得到玻尔兹曼统计法的第二个基本假设: 对于处于热力学平衡态的孤立系,系统的宏观态就是最概然分布所对应的宏观状态。 这一假设告诉我们,尽管有许多宏观态可能出现,但当系统处于热力学平衡态时,最概

7 然分布所对应的微观状态数几乎等于系统的全部可能的微观状态数,实际测量到的是最概然 分布所对应的宏观状态。 综上所述,在讨论宏观系统的热运动时,我们必须把组成该系统粒子的力学规律和统计 规律结合在一起才能得到系统的热运动规律和宏观性质,因此,人们又把这门学科称之为统 计力学