2 还有其他的资源（人力，物力）分配问题、生产贮存问题、最优装载问题、水库

正在加载图片...

还有其他的资源（人力，物力）分配问题、生产贮存问题、最优装载问题、水库优化问题、最优控制问题等等，都具有多阶段决策问题的特性，均可用动态规划方法去求解。 §4.2动态规划的基本概念和基本方程（书§8.2）下面通过讨论例1.1(P192图8-2)的解法来说明动态规划的基本思想，并阐述基本概念。从A到G分6个阶段：A到B,B到C,C到D,D到E,E到F,F到G。在第1阶段，A为起点，有2个选择：→B1,→B2。若选择→B1,则得到下阶段的起点B1,若选择 →B2,则得到下阶段的起点B2。如果所做的决策是→B2,则得到下阶段的起点为B2。在第2阶段，对起点B2,有3个选择：→C2,→C3,C4。若选择→C2,则得到下阶段的起点C2, 若选择→C3,则得到下阶段的起点C3,若选择→C4,则得到下阶段的起点C4。如果所做的决策是→C2, 则得到下阶段的起点为C2。依次类推，可看到各个阶段所做的选择不同，则得到的路线就不同。很明显，当某阶段的起点给定时，它直接影响后面各阶段的行进路线和整个路线的长短，而后面各阶段路线的发展不受这点以前各阶段路线的影响。故此问题的要求是：在各个阶段选取一个恰当的决策，使由这些决策组成的一个决策序列所决定的一条路线为最短其路线。方法一：枚举法，即把由A到G的所有可能的路线的距离都算出来，互相比较得最短者。可能的路线个数：2×3×2x2×2×1=48。显然此方法计算相当繁，计算量大，当段数很多时，不现实。方法二：动态规划方法。 4.2.1动态规划的基本概念 (1)阶段：把所给问题的过程，恰当地分为若干个相互联系的阶段，以便能按一定的次序去求解。阶段的划分一般根据时间和空间的自然特征来划分，但要便于把问题的过程能转化为多阶段决策过程。用k表示第k个阶段。如在例4.1.1中，根据空间位置把问题的过程划分为6个阶段，分别用=1,23,4,5,6表示。 (2)状态：表示每个阶段开始时所处的自然状况或客观条件，它描述了研究问题过程的状况，又称不可控因素，用$4表示第k个阶段的状态。通常，一个阶段可有若干个状态，这些状态的集合称为允许状态集，用S表示第k个阶段的允许状态集，显然S4∈S4。如在例41.1中，状态就是某阶段的出发位置，它既是该阶段某支路的起点，又是前一阶段某支路的终点。第一阶段有1个状态就是A,第二阶段有2个状态，即B1,B2,因此s1∈S={A},S2∈S2={B1, B2} 状态必须具有如下性质。无后效性（马尔科夫性）：如果某阶段状态给定后，则在这阶段以后过程的发展不受这阶段以前各段状态的影响。换句话说：过程的过去历史只能通过当前的状态去影响它未来的发展，当前的状态是以往历史的一个总结。 (3)决策：表示当过程处于某一阶段的某个状态时，可以作出的不同决定（或选择），从而确定下一阶段的状态。用，(s)表示第k个阶段状态为s%时所做的决策以得到第什1阶段的状态。通常，在状态S联处有若干个决策可供选择，这些决策的集合称为允许决策集，U(s)表示，显然(s)∈U4(S)。如在例4.1.1，h(B2)∈U2(B2)={→C2,→C3,→C4}。2 还有其他的资源（人力，物力）分配问题、生产贮存问题、最优装载问题、水库优化问题、最优控制问题等等，都具有多阶段决策问题的特性，均可用动态规划方法去求解。 §4.2 动态规划的基本概念和基本方程(书§8.2) 下面通过讨论例 1.1（P192 图 8-2）的解法来说明动态规划的基本思想，并阐述基本概念。从 A 到 G 分 6 个阶段：A 到 B，B 到 C，C 到 D，D 到 E，E 到 F，F 到 G。在第 1 阶段，A 为起点，有 2 个选择：→B1，→B2。若选择→B1，则得到下阶段的起点 B1，若选择 →B2，则得到下阶段的起点 B2。如果所做的决策是→B2，则得到下阶段的起点为 B2。在第 2 阶段，对起点 B2，有 3 个选择：→C2，→C3，→C4。若选择→C2，则得到下阶段的起点 C2，若选择→C3，则得到下阶段的起点 C3，若选择→C4，则得到下阶段的起点 C4。如果所做的决策是→C2，则得到下阶段的起点为 C2。依次类推，可看到各个阶段所做的选择不同，则得到的路线就不同。很明显，当某阶段的起点给定时，它直接影响后面各阶段的行进路线和整个路线的长短，而后面各阶段路线的发展不受这点以前各阶段路线的影响。故此问题的要求是：在各个阶段选取一个恰当的决策，使由这些决策组成的一个决策序列所决定的一条路线为最短其路线。方法一：枚举法，即把由 A 到 G 的所有可能的路线的距离都算出来，互相比较得最短者。可能的路线个数：2×3×2×2×2×1=48。显然此方法计算相当繁，计算量大，当段数很多时，不现实。方法二：动态规划方法。 4.2.1 动态规划的基本概念（1）阶段：把所给问题的过程，恰当地分为若干个相互联系的阶段，以便能按一定的次序去求解。阶段的划分一般根据时间和空间的自然特征来划分，但要便于把问题的过程能转化为多阶段决策过程。用 k 表示第 k 个阶段。如在例 4.1.1 中，根据空间位置把问题的过程划分为 6 个阶段，分别用 k=1,2,3,4,5,6 表示。（2）状态：表示每个阶段开始时所处的自然状况或客观条件，它描述了研究问题过程的状况，又称不可控因素，用 sk表示第 k 个阶段的状态。通常，一个阶段可有若干个状态，这些状态的集合称为允许状态集，用 Sk表示第 k 个阶段的允许状态集，显然 sk∈Sk。如在例 4.1.1 中，状态就是某阶段的出发位置，它既是该阶段某支路的起点，又是前一阶段某支路的终点。第一阶段有 1 个状态就是 A，第二阶段有 2 个状态，即 B1，B2，因此 s1∈S1={A}，s2∈S2={B1， B2}。状态必须具有如下性质。无后效性（马尔科夫性）：如果某阶段状态给定后，则在这阶段以后过程的发展不受这阶段以前各段状态的影响。换句话说：过程的过去历史只能通过当前的状态去影响它未来的发展，当前的状态是以往历史的一个总结。（3）决策：表示当过程处于某一阶段的某个状态时，可以作出的不同决定（或选择），从而确定下一阶段的状态。用 uk(sk)表示第 k 个阶段状态为 sk时所做的决策以得到第 k+1 阶段的状态。通常，在状态 sk处有若干个决策可供选择，这些决策的集合称为允许决策集，Uk(sk)表示，显然 uk(sk)∈Uk(sk)。如在例 4.1.1，u2(B2)∈U2(B2)={→C2，→C3，→C4}

<<向上翻页向下翻页>>

点击下载：上海交通大学：《运筹学》教学资源（课程讲义）第四章动态规划