教案 无条件极值 教学内容 最大值和最小值问题大量地出现于理论研究和客观实际之中,例如,路程最 短、用料最省、产量最多、收益最大等等。而最大值或最小值问题往往通过极值 问题来解决。由于许多问题往往受到多个因素的影响和制约,因此有必要讨论多 元函数的极值问题和最值问题。本节中主要讲解以下几方面的内容 (1)多元函数极值的概念与取极值的必要条件; (2)多元函数取极值的充分条件 (3)多元函数的最值问题; (4)最小二乘法与矛盾方程组。 教学思路和要求 (1)与一元函数类似,多元函数的最值与极值有着密切联系,且最值问题 的讨论,往往先从极值问题入手,因此我们先从函数的极值问题展开。 (2)由于关于一元函数已经讨论过极值和最值问题,学生掌这些概念、方 法和计算并不困难,但教师应通过实例指出多元函数的极值和最值问题仍有其特 点与复杂性。当充分性条件失效时,对于极值问题如何处理;对最值问题如何讨 论,都是要请清楚其复杂性的。同时,还要介绍一些计算技巧。 (3)由于最小二乘法与求矛盾方程组的最小二乘解的思想和方法在实际中 应用比较广泛,因此有必要将问题的来龙去脉讲清楚,计算方法讲清楚,不能 带而过。 教学安排 多元函数的无条件极值 多元函数的极值刻画了多元函数的一个局部性质。 定义7.7.1设n元函数∫定义于开集ΩcR”上,x0∈Ω。如果存在δ>0, 使得 f(x)≥f(x0)(或f(x)≤f(x0),x∈Ox0,0), 则称x为∫的一个极小值点(或极大值点),称∫(x)为相应的极小值(或极大 值),极小值点和极大值点统称为极值点,极小值和极大值统称为极值。 例函数z=x2+2y2在(0,0)点取极小值0,这是因为在(0,0)的任何邻域中 异于(0,0)的点处,函数均取正值 例函数z=xy在(O,0)点既不取到极大值,也不取到极小值。因为在点0,0) 处函数值为0,而在该点的任一邻域内,总有使函数值为正的点,也有使函数值 为负的点。 Fermat定理指出,对于一元函数而言,如果∫在点x处可导,那末x0是∫的 极值点的必要条件是f(x0)=0。由这个结果可以直接导出多元函数极值点的 个必要条件 定理7.7.1(极值点的必要条件)设x0=(x10)…,x0)是n元函数∫的一个
1 1 2 n f n R x0 0 ( ) ( ) x x0 f f ( ) ( )) x x0 f f ( , ) x O x0 x0 f ( ) x0 f 2 2 z x 2y (0, 0) 0 (0, 0) (0, 0) z xy (0, 0) (0, 0) 0 Fermat f 0 x 0 x f f (x0 ) 0 ( , , ) (0) (0) 0 1 n x x x n f
极值点,且∫在x处各个一阶偏导数均存在,则必有 f,(x0)=0,i=12…,n 证固定除x外的其余n-1个量,考察一元函数 P, (x)=f(x 则q在点x处可导,且x是q的极值点。由 Fermat定理,即得q(x0)=0,亦 即 f(x0)=0 f的各个一阶偏导数均为0的点称为它的驻点。定理771就是说:在偏导 数存在的前提下,极值点必定是驻点。 驻点未必是极值点,例77.2就说明了这一点。 偏导数不存在的点也可能是极值点。例如f(x,y)=x|,函数z=f(x,y)所对 应的图象是一个柱面,可见在Oxy平面上整个y轴上每一个点(O,y)都是f的极 小值点,但是在这些点上∫关于x的偏导数均不存在 二.取极值的充分条件 如何判别一个驻点是否为极值点?下面的定理提供了一个充分条件 定理77.2(极值点的充分条件)设n元函数∫在x0的某邻域上具有各个 二阶连续偏导数,x0是∫的一个驻点,∫的 Hessian矩阵为 则当在点x处H正定时,x为∫的极小值点;在点x处H负定时,x是∫的 极大值点 证由于x0是∫的驻点,所以 f(x)=0,i=1,2,… 由上一节末给出的∫在x处的一阶 Taylor公式得到 f(x)-f(xo)=(Ar)H(xo +BAx)Ar 其中△x=x-x0,00,使得x∈O(x,δ)时,H(x)的各阶顺序主子式均 取正值,也就是说,此时H(x)是正定矩阵。于是当04Ax|kδ时, (△x)2H(x0+x)△x>0, 所以 f(x)-f(x0) 即x是∫的极小值点。 当H在x处负定时,-H(x0)正定,从而x是-f的极小值点,即是∫的 极大值点
2 f x0 (x0 ) 0 i x f i 1,2, ,n i x n 1 ( ) ( , , , , , , ) (0) (0) 1 (0) 1 (0) i i 1 i i i n x f x x x x x i (0) i x (0) i x i Fermat ( ) 0, (0) i xi i x f (x0 ) 0 f 0 7.7.1 7.7.2 f (x, y) | x | z f (x, y) Oxy y (0, y) f f x n f x0 x0 f f Hessian n n n n n n x x x x x x x x x x x x x x x x x x f f f f f f f f f 1 2 2 1 2 2 2 1 1 1 2 1 H x0 H x0 f x0 H x0 f x0 f (x0 ) 0 i x f i 1,2, ,n f x0 Taylor x x (x) H(x x)x 2 1 ( ) ( ) 0 0 T f f x x x0 0 1 ( ) H x0 Hessian i j x x f x0 0 ( , ) x O x0 H(x) H(x) 0 || x || (x) H(x0 x)x 0 T f (x) f (x0 ) 0 x0 f H x0 ( ) H x0 x0 f f
证毕 例求u=f(x,y,2)=x3+y2+z2+6xy+2z的极值点。 解先求出函数f的驻点,为此,解方程组 0 ay=2y+6x=0, u2=2x+2=0 即得两个驻点P6,-18,-1),Q0,0,-1)。函数∫在点(x,y,2)处的 Hessian矩阵 为 H=620 于是 3660 060 H(P)=620,H(Q)=620 因为 36>0,620=72>0 所以H(P)是正定阵,由定理772可知,P是函数f的极小值点。 容易验证H(Q并非正定阵,从而不能用定理772判断Q是否为极值点。 由直接计算可得H(Q)的三个特征值为 1=2,2=1+√37,=1-√37 当我们取Ax为H(Q相应于特征值λ的特征向量时,可得 (Ax)2H(QAx=λ(A 即(Ax)H(QAx与λ同号,再利用 Hessian矩阵中各元素的连续性可知,当特 征向量的范数Ax充分小时 f(x)-f(xo)=-(Ar)H(xo +BAr)Ax 与λ同号。注意到λ,A2>0,3f(xa),又能取得x,使得∫(x)0时 )是∫的极值点。且当∫ 时,(x0,y)是 极小值点;当∫(xy)<0时,(x0,y)是极大值点; (2)当Δ<0时,(x0,y)不是∫的极值点
3 u f (x, y,z) x y z 6xy 2z 3 2 2 f 2 2 0, 2 6 0, 3 6 0, 2 u z u y x u x y z y x P(6, 18, 1) Q(0, 0, 1) f (x, y,z) Hessian 0 0 2 6 2 0 6x 6 0 H 0 0 2 6 2 0 36 6 0 H(P) 0 0 2 6 2 0 0 6 0 H(Q) | 36 | 0 36 0 6 2 36 6 72 0 0 0 2 6 2 0 36 6 0 H(P) 7.7.2 P f H(Q) 7.7.2 Q H(Q) 1 2 2 1 37 3 1 37 x H(Q) i x H x x x T i T ( ) (Q) ( ) x H T ( ) (Q)x i Hessian || x ||x x (x) H(x x)x 2 1 ( ) ( ) 0 0 T f f i 1 ,2 0 3 0 x0 x ( ) ( ) x x0 f f x ( ) ( ) x x0 f f x0 f z f (x, y) ( , ) 0 0 x y ( , ) 0 0 x y f 2 0 0 0 0 0 0 f (x , y ) f (x , y ) [ f (x , y )] xx yy xy 0 ( , ) 0 0 x y f f xx (x0 , y0 ) 0 ( , ) 0 0 x y f xx (x0 , y0 ) 0 ( , ) 0 0 x y 0 ( , ) 0 0 x y f
注当Δ=0时,(x0,y)是否为极值点需另行讨论。 证因为△>0且f"(x0,y0)>0等价于∫在(x0,y0)处的 Hessian阵正定;同 样,△>0且∫"(x,y0)0时,f9为极大值:;当a0=f(2,2), 所以(2,2)是函数∫的极小值点 例讨论f(x,y)=x2-2xy2+y4-y3的极值
4 0 ( , ) 0 0 x y 0 f xx (x0 , y0 ) 0 f ( , ) 0 0 x y Hessian 0 f xx (x0 , y0 ) 0 f ( , ) 0 0 x y Hessian 1 f ( , ) 0 0 x y Hessian 0 ( , ) 0 0 x y f a 0 f (x, y) xy(a x y) f ( ) 0 ( ) 0, f x a x y xy f y a x y xy y x (0, 0) (a, 0) (0, a) 3 , 3 a a f x y y xx ( , ) 2 2 2 f f f ( 2x)( 2y) (a 2x 2y) xx yy xy a 4x 4y 4ax 4ay 2 2 2 | | | 0 2 (0,0) (a,0) (0,a) a (0, 0) (a, 0) (0, a) f 0 3 1 | 2 3 , 3 a a a a a a f xx 3 2 3 , 3 a 0 3 27 , 3 3 a a a f a 0 3 27 , 3 3 a a a f 4 4 f (x, y) (x 2) (x y) ( , ) 4( ) 0 ( , ) 4( 2) 4( ) 0, 3 3 3 f x y x y f x y x x y y x (2, 2) f xx f yy f xy 0 | (2,2) 0 7.7.2 f (2, 2) (x, y) (2, 2) ( , ) ( 2) ( ) 0 (2,2) 4 4 f x y x x y f (2, 2) f 2 2 4 5 f (x, y) x 2xy y y
解解方程组 0a0 4xy+4y3-5y4=0 求得驻点(00)。再计算二阶偏导数, 4x+12y2-20y 在(00)处有AC-B2=0,这时候无法用定理判定 注意到f(00)=0,以及f(x,y)=(x-y2)2-y3,那么,在曲线x=y2,y>0 上f(x,y)0,因此f(00)=0不是极值(见 下图)。 函数的最值 函数的最值是指函数在某区域上的最大值或最小值。如果说函数的极值是 个局部性的概念,那么函数的最值却是一个涉及整体性质的概念 当我们考虑函数的最值时,应当把区域内部所有极值点上的函数值和在区域 边界上的函数值作比较来确定。在通常遇到的实际问题中,如果所讨论的函数在 区域内部偏导数处处存在,而根据问题性质,又能确定其最值一定在区域内部取 得,当这个函数只有一个驻点时,可以肯定这个驻点就是函数的最值点。 例有一块宽12cm的薄金属片,把它的两边折起,做成一个截面为等腰梯 形的水槽(图77.1),问怎样析方能使梯形截面的面积最大? 解设截面梯形的腰长为x,腰与底边夹角为α,于是截面积F为 F(x, a)=-[(2-2x)+(12-2x+ 2xcos a)lrsin a =12xsin a-2x-sina+x sin acos o 根据问题的实际背景 D(F={(x,a)0≤x≤6,0≤a≤m}。 先求F在区域D(F)内部的驻点。解方程组 F(, a=12sin a-4xsin a + 2xsin a cosa=0 F(, a)=12xcosa-2x cosa+x(cos a-sin a)=0 当x>0,0<α<π时,原方程可简化为 6-2x+xcosa=0 12 cosa-2xcosa+x(2cos a-1)=0
5 4 4 5 0. 2 2 0, 3 4 2 xy y y y f x y x f (0,0) 2 3 2 2 2 2 2 2, 4 , 4x 12y 20y y f y x y f x f (0,0) 0 2 AC B f (0,0) 0 2 2 5 f (x, y) (x y ) y , 0 2 x y y f (x, y) 0 , 0 2 x y y f (x, y) 0 f (0,0) 0 12cm 7.7.1 x F [(12 2 ) (12 2 2 cos)] sin 2 1 F(x, ) x x x x 12 sin 2 sin sincos 2 2 x x x D(F) {(x,)| 0 x 6, 0 } F D(F) ( , ) 12 cos 2 cos (cos sin ) 0. ( , ) 12sin 4 sin 2 sin cos 0, 2 2 2 2 F x x x x F x x x x x 0 0 12 cos 2 cos (2cos 1) 0. 6 2 cos 0, 2 x x x x y , 0 2 x y y O x , 0 2 x y y
由此可得coa= 4,即 4|=12√3≈20.8cm2) 由于在边界x=0,a=0及a=上F(x,a)均为 12-2x 0,且maxF(6,a)=max(18si2a)=18,因此F的最 图771 值必定在D(F)的内部达到,而x=4 是唯 可能达到最值的解,因此这就是所求的。 四.最小二乘法 在实践活动中,经常需要从一组统计数据(x,y)(i=1,2,…,n)中寻求变量 与y间函数关系的近似表达式,即经验公式。最小二乘法就是建立经验公式的 种常用方法 先从简单的情况谈起。在平面直角坐标系中,即坐标为(x,y)的点为A1 (i=1,2,…,n)。假设这些点分布在某条直线附近,我们就认为x,y间存在着线 性关系 y=ax+b。 如果所有的A恰好都在直线y=ax+b上,自然令人满意,但这类理想的情 况往往并不可能。当x=x时,经实测获得的数据是y,而直线上相应的纵坐标 却是ax+b,两者有误差δ=y-(ax1+b)。显然,合理的挑选a,b的标准应满 足“总体偏差不很大”的原则。而总体的偏差通常又以诸δ的平方和作标准来衡 量 以偏差δ的平方和为标准来选取a,b的方法就是最小二乘法 △(ab)=∑Ly-(ax+b)2。 为求使Δ(ab)最小的(a,b),应用多元函数求极值的方法可知,a,b应满足方程组 ∑2(y-ax-b)(-x)=0 ∑2(y-ax-b)(-1)=0 ab xi Vi 由这个方程组解得a,b,再代入y=ax+b,即得到所求的经验公式 例经实际测定,某种型号空调的制冷功率(单位:千瓦)与噪声(单位: 分贝)有如下关系:
6 2 1 cos x 4 3 x 4 12 3 20.8 3 4, F (cm ) 2 x 0 0 F(x,) 0 maxF(6,) max(18sin 2) 18 F D(F) x 4 3 ( , ) i i x y i 1,2, ,n x y ( , ) i i x y Ai i 1,2, ,n x, y y axb Ai y axb i x x i y axi b y (ax b) i i i a,b i i a,b n i a b yi axi b 1 2 ( , ) [ ( )] (a,b) (a,b) a,b 2( )( 1) 0, 2( )( ) 0, 1 1 n i i i n i i i i y ax b b y ax b x a x n x x n i i n i i n i i 1 1 1 2 b a = n i i n i i i y x y 1 1 a,b y axb 12-2x 12 x x 7.7.1
制冷功率334343363.323.343363.383434342 噪声49250493494949.549849950.2502 当它以4千瓦功率能力工作时,噪声能否小于60分贝? 解记制冷功率为x,噪声为y。将这些数据画在坐标纸上,发现它们呈直 线关系,所以有理由猜测,y是x的一次函数,即 y=ax+b 50.2 0.0 4 3.:35 制冷能力(kw) 图772 分别以x,y,记实测所得的制冷功率与噪声,按前述方法便得方程组 113.713633.72)(a 1672.984 3210八b 496.1 由此解得 13.81 于是,制冷功率x与噪声y近似满足 y=13.81x+3.04。 制冷功率3343403363323343363.38340340342 实测噪声4920500049304900490049504980499050205020 计算噪声|49.1714999494448949.17494449.7249949995027 相对误差(%)0.070.010.290.230.340.120.170.190.410.14 当制冷功率x=4千瓦,噪声y近似值为5828分贝,根据以上数据的相对误 差,有把握不超过60分贝。 例通过观察知道,红铃虫的产卵数与温度有关,下面是一组实验观察值 温度|21 产卵数7 24 66 105325 试确定产卵数与温度的近似函数关系。 解记温度为x,产卵数为y。将数据画在坐标纸上,看起来两者呈指数关 系。设对应的近似关系是 其中B=e。两边取对数,再作代换y=hny,就得到
7 3.34 3.4 3.36 3.32 3.34 3.36 3.38 3.4 3.4 3.42 49.2 50 49.3 49 49 49.5 49.8 49.9 50.2 50.2 4 60 x y y x y = ax + b 7.7.2 i x i y 33.72 10 113.7136 33.72 b a = 496.1 1672.984 b a = 3.04 13.81 x y y = 13.81 x + 3.04 3.34 3.40 3.36 3.32 3.34 3.36 3.38 3.40 3.40 3.42 49.20 50.00 49.30 49.00 49.00 49.50 49.80 49.90 50.20 50.20 49.17 49.99 49.44 48.89 49.17 49.44 49.72 49.99 49.99 50.27 (%) x = 4 y 58.28 60 x y ax b ax y e e e b e y ~=ln y
y=ax+b 300 250 50 温度 图7.7.3 将观察数据转化为下表 y=hy|1.94592.39793.0453.17814.18974.65405.7839 应用最小二乘法即得 y=026921x-3.78495, 转换回去,就得到了红铃虫的产卵数与温度的关系为 =0.0227e02692k 也可以设想,本题的数据分布是双曲线的一部分,这时可设对应的近似关系 为 a +b 作代换y=1,x=1,同样变成了线性问题 y=ax+b, 求出a,b后,代回上面的式子就可以了。 五.矛盾方程组 用最小二乘法寻求经验公式的思路又表现为寻求“矛盾方程组”的解 我们知道,若线性方程组 Ax= b 的系数矩阵的秩与其增广矩阵的秩不相等,则方程组无解。此时,称原方程组为 矛盾方程组 从理论上判断,许多实际问题一定是有解的。但由于许多数据是通过测量或 统计得到的,因此方程组的系数难免有这样那样的误差;同时,将实际问题归结 为数学问题(即数学建模)的思想、方法、工具常常会受到种种限制,未必能恰 如其分地反映问题固有的内在规律,这些都会造成本来可解的问题变得不可解 然而,科学研究、生产过程、经济活动等领域又要求我们必须找到这些问题的解 所以,研究如何处理这一类方程具有非常重要的意义。 既然数据本身就带有误差,也就是说,即使求得了它的精确解,对问题来说 也仅仅是一个近似解而已。那么一个合理的思路是,是否可以就以矛盾方程组为 对象,求出它的一个尽可能精确的近似解,作为问题的近似解
8 y ~ = a x + b x y ln y ~ 0.26921 3.78495 ~ y x x y 0.26921 0.02271e b x a y 1 y ~= y 1 x ~ x 1 y ~ = a x ~ + b a b Ax = b
所谓“尽可能精确”是这么定义的: 定义7.7.2设A∈Rm,x∈Rm,b∈R",线性方程组 Ax= b 的系数矩阵是列满秩的,且系数矩阵的秩不等于其増广矩阵的秩。若存在向量ξ, 使得 ∑[b-(A)]=m∑[b-(Ax)], x∈R 则称为这个方程组的最小二乘解 当A列满秩时,AA是非奇异矩阵。这是因为如果deHA=0,则存在 x∈R"(x≠0),使得A'Ax=0,于是xAAx=0,进而得Ax=0,与A列 满秩矛盾。因此以AA为系数矩阵的线性方程组的解存在唯 定理7.7.3文是线性方程组 Ax=b 的最小二乘解的充分必要条件是,是线性方程组 AAx= a b 的解 证根据定义,如果x=(x1…,xn)是Ax=b的最小二乘解,即文是m元函 f(x1…,xm)=∑(b-∑anx1)2 的最小值点。由极值点的必要条件,应有 f m)。而 ax 点=2 au r)0 所以 ∑∑1a4x=∑b,k=12,…,m AAx=a'b 现在只要证明AA=Ab时,¥一定是函数∫的最小值点。因为 =Ab等价于F是∫的驻点,所以 f(x)-f(X)=(x-x)H(x+(x-)(x-x) 但是,因为∫是二次函数,故H是常值矩阵,由直接计算可知 所以H=2ArA。于是 f(x)-f(x)=(x-x)A A(x-x 因为A是列满秩的,故当x≠时A(x-x)≠0,从厉。 f(x)-f(x)>0, 即是函数∫的最小值点
9 7 A nm R x m R b n R Ax = b x ~ n i bi A i 1 2 ) ] ~ [ ( x = n xR min n i bi A i 1 2 [ ( x) ] x ~ A A A T detA A 0 T n xR x 0 A Ax 0 T x A Ax 0 T T Ax 0 A A A T 7 x ~ A x = b x ~ A A T x = T A b T m (x , , x ) ~ x 1 Ax b x ~ m 2 1 1 1 ( , , ) ( ) m j i j j n i m i f x x b a x 0 k x f k 1,2, ,m 2 ( )( ) 1 1 i k m j i j j n i i k b a x a x f n i n i ik i m j aijaik x j a b 1 1 1 k 1,2, ,m A Ax A b T T A Ax A b T T ~ x ~ f A Ax A b T T ~ x ~ f ) ~ ))( ~ ( ~ ) ( ~ ( 2 1 ) ~ (x) (x x x H x x x x x T f f f H 2 , 1 2 n i ik il k l a a x x f H A A T 2 ) ~ ) ( ~ ) ( ~ (x) (x x x A A x x T T f f A x x ~ ) 0 ~ A(x x ) 0 ~ f (x) f (x x ~ f
证毕 例有些商品的销售量是有季节性的。某商店一年中各个月份出售某种型号 的单冷空调的数量如下(单位:台): 匚月份 销售量□13219924139323360383375297244178 试确定销售量与月份的近似函数关系。 解记月份为x,销售量为y将这些数据画在坐标纸上,发现它们呈抛物 线。于是设 ax tbx 200 0 8 月份 图774 将其表成方程组 3 93 C 这是一个矛盾方程组,为求其最小二乘解,可在两边左乘系数矩阵的转置,得到 方程组 607106084650(a 156430 608465078b 20312 解出a、b、c后,就得到近似关系式 y=-862x2+110.01x+1575 六.进一步的问题 作为本节讨论的继续,下一节将讨论条件极值问题。 七.习题 1;2;4;6.(1);7;8;10;11;13
10 x y y ax bx c 2 7.7.4 144 12 1 9 3 1 4 2 1 1 1 1 c b a = 98 241 199 132 650 78 12 6084 650 78 60710 6084 650 c b a = 3169 20312 156430 a b c y = 8.62 x 2 + 110.01 x + 15.75 1 2 4 6 1 7 8 10 11 13