第六章多元函数的极值问题 §4.1普通极值问题 设f(x1…,xn)是集合ScR"上的函数,如果对P=(x1,…,xn),存在P在R"中 的邻域U,使得ⅦP=(x1…xn)∈S∩U,恒有∫(x1…,x)≤∫(x19…,x2) (f(x1,…xn)≥f(x,…,x),则f(x0…,x)称为f(x1…,x)在S上的局部极大值 (极小值),B称为∫(x1,…,x)的局部极大值(极小值)点.如果S是开集,则P称为普 通极值点.否则称为条件极值点 定理1:如果P=(x,…x0)是∫(x1…,xn)的普通极值点,且f(x1…,x)在P存 在偏导,则(x…x2) 证明:P是内点,因而x是一元函数f(x1,x2…,x0)的极值点,因此 0 定义:设f(x1…,x)在区域D上处处有偏导.如果在点P=(x,…,x)成立 ax 0,i=1…,n,则称P为∫(x1…,x)的判别点 如果P是∫(x1,…,xn)的极值点,则其是f(x1…,xn)的判别点但反之并不成立 例:令∫(x,y)=x (00)-0(00)- 0.但(00)并不是f(x,y)的极 值点 与一元函数相同,我们需要利用∫(x12…,xn)在判别点处的二阶 Taylor展开来讨论所 给判别点是否极值点以及是什么样的极值点.为此我们需要下面引理 引理:设n阶对称矩阵A是正定(负定)的,则存在E>0,使得对任意(x1,…,xn),恒
1 第六章 多元函数的极值问题 §4.1 普通极值问题 设 ( , , ) 1 n f x L x 是集合 n S Ì R 上的函数, 如果对 ( , , ) 0 0 0 1 n P = x L x , 存在 P0 在 n R 中 的邻域 U , 使 得 "P = (x1 ,L, xn )Î S IU , 恒 有 ( , , ) ( , , ) 0 0 1 n 1 n f x L x £ f x L x ( ( , , ) ( , , )) 0 0 1 n 1 n f x L x ³ f x L x , 则 ( , , ) 0 0 1 n f x L x 称为 ( , , ) 1 n f x L x 在 S 上的局部极大值 (极小值), P0 称为 ( , , ) 1 n f x L x 的局部极大值(极小值)点. 如果S 是开集, 则P0 称为普 通极值点. 否则称为条件极值点. 定理 1: 如果 ( , , ) 0 0 0 1 n P = x L x 是 ( , , ) 1 n f x L x 的普通极值点, 且 ( , , ) 1 n f x L x 在 P0 存 在偏导, 则 0, 1, , . ( , , ) 0 0 1 i n x f x x i n L L = = ¶ ¶ . 证 明 : P0 是内点 , 因 而 0 1 x 是一元函数 ( , , , ) 0 0 1 2 n f x x L x 的极值点 . 因 此 0 ( , , ) 1 0 0 1 = ¶ ¶ x f x x L n . 定义 : 设 ( , , ) 1 n f x L x 在区域 D 上处处有偏导. 如果在点 ( , , ) 0 0 0 1 n P = x L x 成立 i n x f x x x i n 0, 1, , ( , , , ) 0 0 2 0 1 L L = = ¶ ¶ , 则称P0 为 ( , , ) 1 n f x L x 的判别点. 如果 P0 是 ( , , ) 1 n f x L x 的极值点, 则其是 ( , , ) 1 n f x L x 的判别点. 但反之并不成立. 例: 令 2 2 f (x, y) = x - y , 则 0 (0,0) 0, (0,0) = ¶ ¶ = ¶ ¶ y f x f . 但(0,0) 并不是 f (x, y) 的极 值点. 与一元函数相同, 我们需要利用 ( , , ) 1 n f x L x 在判别点处的二阶 Taylor 展开来讨论所 给判别点是否极值点以及是什么样的极值点. 为此我们需要下面引理. 引理: 设n 阶对称矩阵 A 是正定(负定)的, 则存在e > 0, 使得对任意( , , ) 1 n x L x , 恒
有 (x…,x)A(x1…,x)2(x2+…+x2)(x,…,x,)4(x1…,x,)≤-(x2+…+x2) 证明:R"中单位球面S={x,…x+…+x=是有界闭集,因而是紧集 Sn上的函数(x1…,xn)A(x1…,xn)连续且处处不为零,因而在Sn上达到最小值,设为E 则对任意(x12…,xn)≠0,恒有 A ≥ 引理得证 定理2:设P=(x1,…,xn)是∫(x1,…,xn)在区域D内的判别点如果∫(x1,…,x) 在P的Hes矩阵H(P)是正定的,则P是f(x1;…,xn)的严格极小点,如果H(P)是 负定的,则P是f(x1…,x)的严格极大点;如果H(P)是不定的,则B不是 ∫(x1…,xn)的极值点 证明:设H/(B)(2f(x…¨x正定,取E>0满足上面引理将∫在P点作 ax ax 二阶 Taylor展开,由(x9…,x0)是判别点得 f∫(x )=d3f(x…x2)+4∑(x-x)2 P (x-x) 由于O在(x1…x)趋于(x,…,x0)时是无穷小,因此存在(x9…,x)的邻域U,使得 (x,…,x,)∈U时5+o>0,得f(x1…,x,)>f(x,…,x3).P是f(x,…,x,)的严 格极小点 如果H(P0)不定,则存在n维向量a≠0和B≠0,使得OH()a>0,而 PH(P)B<0.令B=B+1,P2=P+甲,则t充分小时P和P2都在D内,且 2
2 有 ( ) 2 2 1 1 1 ( , , ) ( , , ) n t n n x L x A x L x ³ e x +L+ x (( , , ) ( , , ) ( )). 2 2 1 1 1 n t n n x L x A x L x £ -e x +L+ x 证明: n R 中单位球面 {( , , ) 1} 2 2 Sn = x1 L xn x1 +L+ xn = 是有界闭集, 因而是紧集. Sn 上的函数 t n n (x , , x )A(x , , x ) 1 L 1 L 连续且处处不为零, 因而在 Sn 上达到最小值, 设为e . 则对任意(x1 ,L, xn ) ¹ 0 , 恒有 ³ e + + + + 2 2 1 1 2 2 1 1 ( , , ) ( , , ) n t n n n x x x x A x x x x L L L L . 引理得证. 定理 2: 设 ( , , ) 0 0 0 1 n P = x L x 是 ( , , ) 1 n f x L x 在区域 D 内的判别点. 如果 ( , , ) 1 n f x L x 在 P0 的Hessi矩阵 ( ) H f P0 是正定的, 则P0 是 ( , , ) 1 n f x L x 的严格极小点; 如果 ( ) H f P0 是 负定的, 则 P0 是 ( , , ) 1 n f x L x 的严格极大点 ; 如 果 ( ) H f P0 是不定的, 则 P0 不 是 ( , , ) 1 n f x L x 的极值点. 证明: 设 ÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ = i j n f x x f x x H P ( , , ) ( ) 0 0 1 2 0 L 正定, 取e > 0 满足上面引理. 将 f 在 P0 点作 二阶 Taylor 展开, 由( , , ) 0 0 1 n x L x 是判别点得 ( ) ( ) ( ) . 2 , , ( ) , , ( ) 2 1 ( , , ) ( ) 2 1 ( , , ) ( , , ) 1 0 2 1 0 0 0 2 0 1 1 0 0 1 1 1 0 0 0 2 1 0 0 2 1 1 ÷ ø ö ç è æ ÷ - ø ö ç è æ ³ + ÷ ø ö ç è æ = - - - - + - ÷ ø ö ç è æ - = + - å å å = = = n i i i n i i i t n n f n n n i n n n i i o x x x x x x H P x x x x o x x f x x f x x d f x x o x x e L L L L L 由于o 在 ( , , ) 1 n x L x 趋于( , , ) 0 0 1 n x L x 时是无穷小, 因此存在( , , ) 0 0 1 n x L x 的邻域U , 使得 (x1 ,L, xn ) ÎU 时 0 2 + o > e , 得 ( , , ) ( , , ) 0 0 1 n 1 n f x L x > f x L x . P0 是 ( , , ) 1 n f x L x 的严 格极小点. 如果 ( ) H f P0 不定, 则存在 n 维向量a ¹ 0 和 b ¹ 0 , 使得 ( 0 ) > 0 t aH f P a , 而 ( 0 ) < 0 t bH f P b . 令P1 = P0 + ta, P2 = P0 + tb , 则t 充分小时 P1和 P2 都在 D 内, 且
f(P)-f(Po)=raH (P)a+0-12 all P lH, (Po a'+olap) 1充分小时,aH,(2yx+)0,因此2不是极大点同理 f(P2)-f(P)= BH, (P)B+o(eBiP) 在t充分小时小于零,因此f不是极小点.得P不是极值点 由定理2,仅当判别点P=(x,…,x)的Hes矩阵H/(P)是半正定或半负定时,我 们不能判定P是否是∫的极小或极大点,这是必须detH/(P)=0 利用定理2,我们需要判定Hess矩阵H,(P)的正定或负定性.对此我们需要下面《线 性代数》中给出的定理 定理3:对称矩阵A=(an),=1是正定(负定)的充分必要条件是A的主子行列式 det(a,a>0() "det(a,1>o 对k=1,…,n成立 例:求∫(x,y)=x2-xy+y2-2x+y的极值点 解:9(x,y) 2x-y-2 af( 2y-x+1.解得判别点为P=(10),而 a(Po)af(Po H(PB)=a2/(B)3/(P)(-12 ax axa 阶主子行列式(a1)=2>0,二阶主子行列式 =3>0,因此H(P0)正定, P=(1,0)是f(x,y)的极小点,∫(10)=-1是∫(x,y)的极小值 §4.2条件极值问题 设F(x1…,xn),…,Fm(x1,…,xn)是区域DcR"上的函数.定义S为
3 ( ) ( ( ) ( )). ( ) ( ) ( ) 2 0 2 2 2 0 2 1 0 a a a a a a t H P o f P f P t H P o t t f t f = + - = + × t 充分小时, ( ) ( ) 0 2 aH P0 a + o a > t f , 因此P0 不是极大点. 同理 ( ) ( ) ( ( ) ( )). 2 0 2 f P2 f P0 t bH P b o b t - = f + 在t 充分小时小于零, 因此P0 不是极小点. 得P0 不是极值点. 由定理 2, 仅当判别点 ( , , ) 0 0 0 1 n P = x L x 的 Hessi矩阵 ( ) H f P0 是半正定或半负定时, 我 们不能判定 P0 是否是 f 的极小或极大点, 这是必须det ( ) 0 H f P0 = . 利用定理 2, 我们需要判定 Hessi 矩阵 ( ) H f P0 的正定或负定性. 对此我们需要下面《线 性代数》中给出的定理. 定理 3: 对称矩阵 n A aij i, j 1 ( ) = = 是正定(负定)的充分必要条件是 A 的主子行列式 det( ) 0 (( 1) det( ) 0) , =1 > - , =1 > k ij i j k k aij i j a 对k = 1,L, n 成立. 例: 求 f (x, y) = x - xy + y - 2x + y 2 2 的极值点. 解: 2 1 ( , ) 2 2, ( , ) = - + ¶ ¶ = - - ¶ ¶ y x y f x y x y x f x y . 解得判别点为 (1,0) P0 = , 而 ÷ ÷ ø ö ç ç è æ - - = ÷ ÷ ÷ ÷ ø ö ç ç ç ç è æ ¶ ¶ ¶ ¶ ¶ ¶ ¶ ¶ ¶ ¶ = 1 2 2 1 ( ) ( ) ( ) ( ) ( ) 2 0 2 0 2 0 2 2 0 2 0 y f P x y f P x y f P x f P H f P . 一阶主子行列式 (a11 ) = 2 > 0 , 二阶主子行列式 3 0 1 2 2 1 = > - - , 因此 ( ) H f P0 正定, (1,0) P0 = 是 f (x, y) 的极小点, f (1,0) = -1是 f (x, y) 的极小值. §4.2 条件极值问题 设 ( , , ), , ( , , ) 1 1 n m 1 n F x L x L F x L x 是区域 n D Ì R 上的函数. 定义S 为
S=(x1 F(x Fn(x 设∫(x12…,xn)是S上的函数,∫(x1…,x)在S上的极值问题称为∫(x13…,xn)对约束 条件F(x1…xn)=0,…F(x1…,x)=0的条件极值.即P0=(x3,…x0)∈S称为 ∫(x1…,xn)对约束条件F1(x13…,xn)=0,…,Fm(x1,…,xn)=0的条件极大(极小)值 如果存在P在R”中的一个邻域U,使得VP=(x,…,x)∈S∩U,恒有 )(f(x1…,xn)≥f(x,…,x) 例:证明在所有周长相同的三角形中,等边三角形面积最大 证明:设三角形三条边为x,y,2.周长固定时x,y,z并非自由变量,受条件 x+y+z=2P的约束,其中p为常数由面积公式知,三角形面积为 p(p-xp-y(p 此我们需求∫(x,y,z)=(P-x)(p-y)(p-z)在条件x+y+2=2p下的最大值 由x+y+z=2p解出z=2p-x-y.这时x,y是自由变量,在一个开集上变化.代 入∫(x,y,),条件极值问题化为 h(x, y)=(p-x)(p-y(x+y-p) 的普通极值问题 解方程组 Jh, (x, y)=(p-y)(2p-2x-y)=0 h,(x,y)=(P-x)(2P-x-2y)=0, 得在x>0,y>0时只有一个解x==p,y=P.但由问题知,最大值存在,而判别点唯 因此判别点只能是最大点,得x==p,y==P,z==P时三角形面积最大 上例中我们是通过求解约束条件的方程,得到自由变量,代入求极值的函数,将条件极 值问题化为普通极值问题.但有时直接解约束条件的方程是困难的,但通过微分约束条件 解出某些变量的微分用另一些变量的微分来表示,再代入求极值函数的微分中,从而求得其 在约束条件下的判别点
4 {( , , ) ( , , ) ( , , ) 0} S = x1 L xn F1 x1 L xn =L = Fm x1 L xn = . 设 ( , , ) 1 n f x L x 是 S 上的函数, ( , , ) 1 n f x L x 在 S 上的极值问题称为 ( , , ) 1 n f x L x 对约束 条件 F1 (x1 ,L, xn ) = 0,L,Fm (x1 ,L, xn ) = 0 的条件极值. 即 P x x S = ( , , n ) Î 0 0 0 1 L 称为 ( , , ) 1 n f x L x 对约束条件 F1 (x1 ,L, xn ) = 0,L,Fm (x1 ,L, xn ) = 0 的条件极大(极小)值. 如果存在 P0 在 n R 中的一个邻域 U , 使 得 "P = (x1 ,L, xn )Î S IU , 恒 有 ( , , ) ( , , ) 0 0 1 n 1 n f x L x £ f x L x ( ( , , ) ( , , )) 0 0 1 n 1 n f x L x ³ f x L x . 例: 证明在所有周长相同的三角形中, 等边三角形面积最大. 证 明 : 设三角形三条边为 x, y, z . 周长固定时 x, y, z 并非自由变量 , 受条件 x + y + z = 2 p 的约束, 其中 p 为常数. 由面积公式知, 三角形面积为 s = p( p - x)( p - y)( p - z) . 因此我们需求 f (x, y,z) = ( p - x)( p - y)( p - z) 在条件 x + y + z = 2 p 下的最大值. 由 x + y + z = 2 p 解出 z = 2 p - x - y . 这时x, y 是自由变量, 在一个开集上变化. 代 入 f (x, y,z) , 条件极值问题化为 h(x, y) = ( p - x)( p - y)( x + y - p) 的普通极值问题. 解方程组 î í ì = - - - = = - - - = ( , ) ( )(2 2 ) 0, ( , ) ( )(2 2 ) 0 h x y p x p x y h x y p y p x y y x 得在 x > 0, y > 0 时只有一个解 x p y p 3 2 , 3 2 = = . 但由问题知, 最大值存在, 而判别点唯 一. 因此判别点只能是最大点, 得x p y p z p 3 2 , 3 2 , 3 2 = = = 时三角形面积最大. 上例中我们是通过求解约束条件的方程, 得到自由变量, 代入求极值的函数, 将条件极 值问题化为普通极值问题. 但有时直接解约束条件的方程是困难的, 但通过微分约束条件, 解出某些变量的微分用另一些变量的微分来表示, 再代入求极值函数的微分中, 从而求得其 在约束条件下的判别点
例:设光在空气和水中的速度分别为v1,V2,设光由空气射入水中时入射角为a,折射 角为β,假定光总在最短时间由一个点运动到另一点证明 SIn a sinβ 证明:如图.设P为光源,Q为光到达的点 空气 a,b为P,Q到水面的距离.设h为PQ到水面投影 点之间的距离,C是水面上任取的一个光的入射点 o\b 水 问题是c在什么位置时,光由P到Q所需时间最短 光在空气和水中总是以直线传播,因此c点确定 后,入射角a和折射角β因而确定,这时所需时间为 v, cosa v, cos B 需求t对a,B的极小值.但α,B并非独立变量,受条件 atga+ btg= h 的约束.问题化为条件极值 de 对aga+bgB=h微分,得a cos C cos2f0,因而 dB b cosB a cos a asin a da + -asin p v, COS B a sin a asin b v, cos S" B 但判别点的一阶微分为零,解得a,B满足 sin a sin B 时at=0.这时判别点是唯一的 而由问题知极小点存在,其必在判别点处达到 上面两例都是先求得判别点唯一,再根据问题性质说明极大极小值的存在性而得到极
5 例: 设光在空气和水中的速度分别为 1 2 v , v , 设光由空气射入水中时入射角为a , 折射 角为 b , 假定光总在最短时间由一个点运动到另一点. 证明 1 2 sin sin v v a b = . 证明: 如图. 设 P 为光源, Q 为光到达的点 , a,b 为 P,Q 到水面的距离. 设h 为 P,Q 到水面投影 点之间的距离, c 是水面上任取的一个光的入射点. 问题是c 在什么位置时, 光由P 到Q 所需时间最短. 光在空气和水中总是以直线传播, 因此c 点确定 后, 入射角a 和折射角 b 因而确定, 这时所需时间为 1 cosa v2 cos b b v a t = + , 需求t 对a,b 的极小值. 但a,b 并非独立变量, 受条件 atga + btgb = h 的约束. 问题化为条件极值. 对atga + btgb = h 微分, 得 0 cos cos 2 2 + = b b a a d b d a , 因而 a a b b d a b d 2 2 cos cos = - , 而 . cos cos cos sin cos sin cos sin cos sin 2 2 2 2 2 1 2 2 2 1 a a b b b a a a b b b a a a d a b v a d v a d v a d v a dt ÷ ÷ ø ö ç ç è æ - - = - + - + - = 但判别点的一阶微分为零, 解得a,b 满足 1 2 sin sin v v a b = 时dt = 0 . 这时判别点是唯一的, 而由问题知极小点存在, 其必在判别点处达到. 上面两例都是先求得判别点唯一, 再根据问题性质说明极大极小值的存在性而得到极 P a a 空气 c ß b 水 Q
值问题的解.这在实际中是常用的 4.3 Lagrang 乘子法 首先我们考虑函数∫(x,y,=)在条件φ(x,y,z)=0下的极值问题.设∫(x,y,)和 q(x,y,z)都是C的函数.令 ∑={(xy,)|o(x,y:)=0 设B=(x0yo,=0)∈Σ是∫(x,y,z)在∑上的一个极值点.任取∑中过f的曲线 y()=(x(,y(m),-(1),设y(0)=B,则t=0是f(x(D),y(1),=()的极值点.因而由费马 定理知 df(x(t),y(t)2(1) a(xo,y0,=0) x(0)+9(x,y=0y(0) t=0 f(x0,y0,=0) 二(0)=0, 即grad(O(P)与切向量(x(0),y(0),=(0)垂直.从而grad((P)与Σ在P点的切面 垂直.假设grad(q)()≠0,由隐函数定理及∑的切面公式知,grad(qP)是Σ在P点 切面的法向量,得存在,使得 grad((Po)=grad(o) po) 反之如果上式成立,则将∫(x,y,2)限制在∑上每一条过P的曲线时,P都是其判别点.因 此可以认为P也是∫(x,y,)在∑上的判别点.为求∫(x,y,)在Σ上的极值点,我们需先 求其判别点,即我们需先解方程gad()(P)=λgrad(q)(P).定义函数 F(x,y,二,A)=f(x,y,)+Aφ(x,y,=) 则求∫(x,y,z)在∑上的判别点与求 dF(x,y, =,1)==dx+=dy+=d+--dn=0 的点是等价的,而第二种形式的方程与求F(x,y,,A)的普通极值的判别点是一致的.这样 从形式上我们将条件极值的问题化为普通极值的问题
6 值问题的解. 这在实际中是常用的. §4.3 Lagrange 乘子法 首先我们考虑函数 f (x, y,z) 在条件 j( x, y,z) = 0 下的极值问题. 设 f (x, y,z) 和 j (x, y,z) 都是 1 C 的函数. 令 S = {(x, y,z) j(x, y,z) = 0}. 设 P0 = (x0 , y0 ,z0 ) Î S 是 f (x, y,z) 在 S 上的一个极值点. 任 取 S 中 过 P0 的曲线 g (t) = ( x(t), y(t),z(t)) , 设 0 g (0) = P , 则t = 0 是 f (x(t), y(t),z(t)) 的极值点. 因而由费马 定理知 (0) 0, ( , , ) (0) ( , , ) (0) ( , , ) 0 ( ( ), ( ), ( )) 0 0 0 0 0 0 0 0 0 ¢ = ¶ ¶ + ¢ ¶ ¶ ¢ + ¶ ¶ = = z z f x y z y y f x y z x x f x y z dt t df x t y t z t 即 grad( )( ) P0 f 与切向量 ( x¢(0), y¢(0),z¢(0)) 垂直. 从而grad( )( ) P0 f 与 S 在 P0 点的切面 垂直. 假设grad(j)(P0 ) ¹ 0 , 由隐函数定理及 S 的切面公式知, grad( )( ) j P0 是 S 在 P0 点 切面的法向量, 得存在l , 使得 grad( )( ) grad( )( ) P0 P0 f = l j . 反之如果上式成立, 则将 f (x, y,z) 限制在S 上每一条过 P0 的曲线时, P0 都是其判别点. 因 此可以认为 P0 也是 f (x, y,z) 在S 上的判别点. 为求 f (x, y,z) 在S 上的极值点, 我们需先 求其判别点, 即我们需先解方程grad( )( ) grad( )( ) P0 P0 f = l j . 定义函数 F( x, y,z,l) = f ( x, y,z) + lj( x, y,z) , 则求 f (x, y,z) 在S 上的判别点与求 ( , , , ) = 0 ¶ ¶ + ¶ ¶ + ¶ ¶ + ¶ ¶ = l l l d F dz z F dy y F dx x F dF x y z 的点是等价的, 而第二种形式的方程与求 F( x, y,z,l) 的普通极值的判别点是一致的. 这样 从形式上我们将条件极值的问题化为普通极值的问题
上面的方法称为 Lagrange乘子法,其可以推广到更一般的形式.为此我们先给出下面 定义设Q1(x1…,xn)…,n(x1…,xn)都是C的函数,令 ∑ q(x2…,x) 设在P=(x,…,x3)处mak|…9m) ()=m,不妨设2…:9m) a(x (P)≠0 由隐函数定理知,存在P的邻域U,使在U上,∑∩U可表示为 (h(xm1…xn)…,hn(xm1…,xn),xn1…,xn) 的形式其中h1(xm1…,xn)…,bn(xn…,x,)是(x0,…,x)的C的函数对于函数 ∫(x1…,xn),其对于Σ的条件极值在P的邻域U上化为 f(h1(xm1…,xn)…,hn(xm+1…,x,)xm1…,xn 的普通极值问题我们称P=(x1,…,xn)为f(x1…,x)在Σ上的条件极值的判别点.如 果(x x)是上面函数对普通极值的判别点 定理1:假设如上,P=(x…x2)为f(x1…,x)在Σ上的判别点的充分必要条件 是存在A1,…,λm,使得 grad(OP0)=(-1)λgrad(φ1)()+…+(-1)λ grad(qn)() 几何说明:与本节开始时的讨论相同,P是∫(x1,…,xn)在∑上的判别点的充分必要 条件是grad(O(B)与Σ在P点的切面垂直,即grad(O(P)在P点的法空间内.但 gead(g1)P0)…grad(qn)P)}是Σ在P点的法空间的线性基,得定理1 证明:P=(x1,…,x0)为∫(x1…,x)在Σ上条件极值的判别点等价于 P=(x01…,x)是f(1(xm1,…,xn)…,hn(xn1…,xn),xnm1,…,x)的判别点,即对 m+1…,n,在P点有 )a ch,+af 7
7 上面的方法称为 Lagrange 乘子法, 其可以推广到更一般的形式. 为此我们先给出下面 定义. 设 ( , , ), , ( , , ) 1 1 n m 1 n j x L x L j x L x 都是 1 C 的函数, 令 {( , , ) ( , , ) ( , , ) 0} S = x1 L xn j1 x1 L xn =L = jm x1 L xn = . 设在 ( , , ) 0 0 0 1 n P = x L x 处 P m D x x D n m =÷ ÷ ø ö ç ç è æ ( ) ( , , ) ( , , ) rank 0 1 1 L j L j , 不妨设 ( ) 0 ( , , ) ( , , ) 0 1 1 ¹ ¶ ¶ P x xm m L j L j . 由隐函数定理知, 存在P0 的邻域U , 使在U 上, S IU 可表示为 ( ) m n m m n m n h (x , , x ), ,h (x , , x ), x , , x 1 +1 L L +1 L +1 L 的形式, 其中 ( , , ), , ( , , ) 1 m 1 n m m 1 n h x L x L h x L x + + 是 ( , , ) 0 0 m 1 n x L x + 的 1 C 的函数. 对于函数 ( , , ) 1 n f x L x , 其对于S 的条件极值在 P0 的邻域U 上化为 ( ) m n m m n m n f h (x , , x ), ,h (x , , x ), x , , x 1 +1 L L +1 L +1 L 的普通极值问题. 我们称 ( , , ) 0 0 0 1 n P = x L x 为 ( , , ) 1 n f x L x 在S 上的条件极值的判别点. 如 果( , , ) 0 0 m 1 n x L x + 是上面函数对普通极值的判别点, 定理 1: 假设如上, ( , , ) 0 0 0 1 n P = x L x 为 ( , , ) 1 n f x L x 在S 上的判别点的充分必要条件 是存在l lm , , 1 L , 使得 grad( )( ) ( 1) grad( )( ) ( 1) grad( )( ) P0 1 1 P0 P0 f = - l j +L+ - lm j m . 几何说明: 与本节开始时的讨论相同, P0 是 ( , , ) 1 n f x L x 在S 上的判别点的充分必要 条件是 grad( )( ) P0 f 与 S 在 P0 点的切面垂直, 即 grad( )( ) P0 f 在 P0 点的法空间内. 但 {grad(j1 )(P0 ),L,grad(j m )(P0 )}是S 在 P0 点的法空间的线性基, 得定理 1. 证 明 : ( , , ) 0 0 0 1 n P = x L x 为 ( , , ) 1 n f x L x 在 S 上条件极值的判别点等价于 ( , , ) ~ 0 0 0 m 1 n P x L x = + 是 ( ) m n m m n m n f h (x , , x ), ,h (x , , x ), x , , x 1 +1 L L +1 L +1 L 的判别点, 即对 j = m + 1,L, n , 在P0 点有 0 1 = ¶ ¶ + ¶ ¶ ¶ ¶ å= j m i j i i x f x h x f
表示成矩阵形式为 off)D(h1,…,h 0 而由 q(2(x n)…,bn(x xn)=0,i=1 得在P点,对i=1,…,m有 0,j=m+1, 表示成矩阵形式,即 D(q1…n)D(h1,…,hn)D(q1,…n) 0 (2) D(x 已知01“9m)(P)≠0、解得 D(h1…hn) D(q1;…,qn)D(q1,… x 代入(1)式,得P是f(x1…,xn)对Σ的判别点等价于 显然 可..0-1D(q…9n)D(1…9n)( 0,与上式 D(x 结合得 ….-1lD(91 D(q1…n)(f D(x1;…,xn)」D afaf Do 4) 则上式为 (1…,λ 反之,如果(λ1,…m)存在,则其必由(4)式给出,代入则(3)式成立,P是f(x1…,xn) 8
8 表示成矩阵形式为: , , 0 ( , , ) ( , , ) , , 1 1 1 1 =÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ ¶ + ÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ ¶ m+ n m+ n m m x f x f D x x D h h x f x f L L L L . (1) 而由 ji (h1 (xm+1 ,L, xn ),L,hm (xm+1 ,L, xn ), xm+1 ,L, xn ) = 0, i = 1,L,m , 得在 P0 点, 对i = 1,L,m 有 j m n x x h x j i m l j l l i 0, 1, , 1 = = + L ¶ ¶ + ¶ ¶ ¶ ¶ å= j j , 表示成矩阵形式, 即 0 ( , , ) ( , , ) ( , , ) ( , , ) ( , , ) ( , , ) 1 1 1 1 1 1 × + = + m+ n m m n m m m D x x D D x x D h h D x x D L L L L L j L j j j . (2) 已知 ( ) 0 ( , , ) ( , , ) 0 1 1 ¹ ¶ ¶ P x xm m L j L j , 解得 ( , , ) ( , , ) ( , , ) ( , , ) ( 1) ( , , ) ( , , ) 1 1 1 1 1 1 1 m n m m m m n m D x x D D x x D D x x D h h L L L L L L + - + ú û ù ê ë é = - j j j j . 代入(1)式, 得P0 是 ( , , ) 1 n f x L x 对S 的判别点等价于 , , 0 ( , , ) ( , , ) ( , , ) ( , , ) , , ( 1) 1 1 1 1 1 1 1 =÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ ¶ ú + û ù ê ë é - ÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ ¶ + + - m n m n m m m m x f x f D x x D D x x D x f x f L L L L L L j j j j . 显然 , , 0, ( , , ) ( , , ) ( , , ) ( , , ) , , ( 1) 1 1 1 1 1 1 1 =÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ ¶ ú + û ù ê ë é - ÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ ¶ - m m m m m m x f x f D x x D D x x D x f x f L L L L L L j j j j 与上式 结合得 , , 0 ( , , ) ( , , ) ( , , ) ( , , ) , , ( 1) 1 1 1 1 1 1 1 =÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ ¶ ú + û ù ê ë é - ÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ ¶ - n n m m m m x f x f D x x D D x x D x f x f L L L L L L j j j j . (3) 令 1 1 1 1 1 ( , , ) ( , , ) ( , , ) ( 1) , , - ú û ù ê ë é ÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ ¶ = - m m m m D x x D x f x f L L L L j j l l , (4) 则上式为 grad( ) grad( ) grad( ) ( , , ) 1 1 f m m = ÷ ÷ ÷ ø ö ç ç ç è æ - j j l L l M . 反之, 如果( , , ) l1 L lm 存在, 则其必由(4)式给出, 代入则(3)式成立, P0 是 ( , , ) 1 n f x L x
在∑上的判别点.证毕 利用定理1,引入变量(λ1,…,m),称为 Lagrange乘子.定义一个新函数 (x1…,xn;λ1,…m)=f(x1,…,xn)+λ191(x1,…,xn) x 则求∫(x1…,x)在Σ上条件极值判别点问题化为求F(x1…,xn;1,…,λn)的普通极值 的判别点的问题,即 定理2:P0=(x,…,x)为f(x1…,x)对Σ的条件极值的判别点的充分必要条件是 存在(A,…,λ0),使得(x,…,x0;A,…,)是F(x1…,xn;A1…,n)的普通极值的判 别点 定理2为求条件极值提供了一个实际可应用的方法.当然其得到的仅是判别点,要说明 所得判别点是否极值点以及是什么极值点还需用Hess矩阵 假设上面讨论的函数都是C2的.设(x9,…,x0;…,)是F(x1…,xn;1…,An) 的判别点.令P=(x…,x0),将(9,…,)固定,考虑F(x1…,xn;19…0)在P的 Hess矩阵 a-F (P) ax ay 分两种情况 1) (ao(P)正定或负定.这时P是F(x1…,xn;0…,n)的极值点而限制 在Σ上时F(x1…,xn;,…,)≡∫(x1…xn)因此P也是f(x1…,x)的相应的条 件极值点 a2F 2aa.()不定或半正定或半货定这时P可能不是F(x1…,x:,,…,) 的极值点.但不能因此判定P不是f(x,”,x)的极值点设(91,…9n)(P)≠0,利 (x1,…,xn) 用dq,=0,i=1,…,m,解出
9 在S 上的判别点. 证毕. 利用定理 1, 引入变量( , , ) l1 L lm , 称为 Lagrange 乘子. 定义一个新函数 ( , , ; , , ) ( , , ) ( , , ) ( , , ) 1 n 1 m 1 n 1 1 1 n m m 1 n F x L x l L l = f x L x + l j x L x +L+ l j x L x , 则求 ( , , ) 1 n f x L x 在 S 上条件极值判别点问题化为求 ( , , ; , , ) 1 n 1 m F x L x l L l 的普通极值 的判别点的问题, 即 定理 2: ( , , ) 0 0 0 1 n P = x L x 为 ( , , ) 1 n f x L x 对S 的条件极值的判别点的充分必要条件是 存在( , , ) 0 0 l1 L lm , 使得( , , ; , , ) 0 0 1 0 0 1 n m x L x l L l 是 ( , , ; , , ) 1 n 1 m F x L x l L l 的普通极值的判 别点. 定理 2 为求条件极值提供了一个实际可应用的方法. 当然其得到的仅是判别点, 要说明 所得判别点是否极值点以及是什么极值点还需用 Hessi 矩阵. 假设上面讨论的函数都是 2 C 的. 设( , , ; , , ) 0 0 1 0 0 1 n m x L x l L l 是 ( , , ; , , ) 1 n 1 m F x L x l L l 的判别点. 令 ( , , ) 0 0 0 1 n P = x L x , 将( , , ) 0 0 l1 L lm 固定, 考虑 ( , , ; , , ) 0 0 1 n 1 m F x L x l L l 在 P0 的 Hessi 矩阵 i j n i j P x y F £ £ ÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ 1 , 0 2 ( ) . 分两种情况. 1) ÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ ( ) 0 2 P x y F i j 正定或负定. 这时 P0 是 ( , , ; , , ) 0 0 1 n 1 m F x L x l L l 的极值点. 而限制 在 S 上时 ( , , ; , , ) ( , , ) 1 0 0 1 n 1 m n F x L x l L l º f x L x . 因此 P0 也是 ( , , ) 1 n f x L x 的相应的条 件极值点. 2) ÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ ( ) 0 2 P x y F i j 不定或半正定或半负定. 这时 P0 可能不是 ( , , ; , , ) 0 0 1 n 1 m F x L x l L l 的极值点. 但不能因此判定 P0 不是 ( , , ) 1 n f x L x 的极值点. 设 ( ) 0 ( , , ) ( , , ) 0 1 1 ¹ ¶ ¶ P x xm m L j L j , 利 用dji = 0, i = 1,L,m , 解出
D(q1…,9n)D(q1,…qn) D(x1;…,xn)」D(xm1,…x,) dx dx 代入二次式∑ a-F(P) dx,dx,,得到dx, dxn的二次式∑a,dxdx,.如果其系数 ax ax 矩阵(an)是正定的,则P是f(x1…,x)在Σ上的极小点,如果(an)是负定的,则P是 f(x1…,xn)在Σ上的极大点 例:设∫(x,y,z)=x+y+z,求其在曲面xyz=c3上的极值点 解:令F(x,y,,)=f(x,y,=)+(xyz-C3),则由dF(x,y,z,A)=0解得 y 如果c=0,得f(x,yz)无判别点,因而无极值点 设C≠0,则在几=-2,P0=(c,C,C)处 8F(PO andy CC 不是正定也不是负定的 对xyz-c3=0微分,在P0=(c,C,c)处,解得=(-dx-d).代入 :F(P) dx dx,=-=(dxdy+dyd=+d=dx 中得二次式 2 dxdy+dy(dx-dy)+(-dx-doy) dx--dxdy-dy dx (dx, d)
10 ÷ ÷ ÷ ø ö ç ç ç è æ ú û ù ê ë é = - ÷ ÷ ÷ ø ö ç ç ç è æ + + - n m m n m m m m dx dx D x x D D x x D dx dx M L L L L M 1 1 1 1 1 1 1 ( , , ) ( , , ) ( , , ) ( , , ) ( 1) j j j j . 代入二次式 å= ¶ ¶ ¶ n i j i j i j dx dx x x F P , 1 0 2 ( ) , 得到dxm dxn , , +1 L 的二次式 å= + n i j m aijdxidx j , 1 . 如果其系数 矩阵 ( ) ij a 是正定的, 则 P0 是 ( , , ) 1 n f x L x 在S 上的极小点; 如果 ( ) ij a 是负定的, 则 P0 是 ( , , ) 1 n f x L x 在S 上的极大点. 例: 设 f (x, y,z) = x + y + z , 求其在曲面 3 xyz = c 上的极值点. 解: 令 ( , , , ) ( , , ) ( ) 3 F x y z l = f x y z + l xyz - c , 则由dF(x, y,z,l) = 0 解得 2 1 , c x = y = z = c l = - . 如果c = 0 , 得 f (x, y,z) 无判别点, 因而无极值点. 设c ¹ 0 , 则在 , ( , , ) 1 2 0 P c c c c l = - = 处 ÷ ÷ ÷ ÷ ÷ ÷ ø ö ç ç ç ç ç ç è æ - - - - - - = ÷ ÷ ø ö ç ç è æ ¶ ¶ ¶ 0 1 1 1 0 1 1 1 0 ( ) 0 2 c c c c c c x y F P 不是正定也不是负定的. 对 0 3 xyz - c = 微分, 在 ( , , ) 0 P = c c c 处, 解得dz = (-dx - dy) . 代入 [dxdy dydz dzdx] c dx dx x x F P i j i j i j = - + + ¶ ¶ ¶ å= ( ) 2 3 , 1 0 2 中得二次式 [ ] [ ] . 1 2 2 1 ( , ) 2 ( ) ( ) 2 2 2 ÷ ÷ ø ö ç ç è æ ÷ ÷ ÷ ÷ ø ö ç ç ç ç è æ = = - - - - - + - - + - - dy dx c c c c dx dy dx dxdy dy c dxdy dy dx dy dx dy dx c