正在加载图片...
其中j<i,而且所有的D:1≠0,而D,1=0。上式称为完善记忆型信息结构【21。它意味着应 史上曾施加给系统的作用全部都提供做为当前的信息。可以证明,线性随机控制的LQG问 题就可以化成具有这种信息结构的队决策问题。若将上式推广,对于所有的而言,只是部 分的D1,中0,(当然仍然是在j<i,且D,1=0的条件下)。它意味着:若两个决策者存在 着先后次序关系,那么先行者知道的信息也必为其后继者所知道。即 Z1=H,5:+D1,u1 j( 这种信息结构称做部分嵌套结构。2!,〔】 部分嵌套结构包括了相当广泛的信息结构类型,如“一步延迟信息共享”结构和“分层” 结构。在大系统问题中它们都是典型的信息结构。若从一个统一的观点来看,它们都不过是 部分嵌套结构的特例而已。 经过近二十年的努力已经得出结论:对于上述所有的信息结构类型,队决策问题(1-1) 式的解u=Y(Z)都是线性的。【1,【1如果注意到前面所提到的在控制理论、信息论、经济管 理和军事科学中的许多问题都可以归结成对(1-1)式求解,而(1-1)式对于上述五种信息结 构的解又都是线性的,那么应该说:通过队决策问题的研究,跨学科地建立一个统一的决策 理论的努力是有成效的!早在1969年,文献7]提出了建立普遍控制理论的目标无疑是卓越 的、迷人的,近十年的进展也是令人鼓舞的。然而,要达到这一目标尚须要跨过一个未曾被 探索过的领域:即决策u的逻辑蕴含方面。迄今为止,决策问题,无论是队决策问题也好, 或者是博奕对策问题也好,论讨中所涉及的变量都是做为实变量来考虑的。例如本文前面所 提到的、Z、“集的元素都是实变量,它们都在实空间2、U、Z上取值。然而,决策过程远 非如此简单。譬如说,人们在做出决定u之前,首先要考虑的不是“应该施加多少作用”, (即u做为实变量如何取值),而是首先要考虑“是否应该施加作用”,(即u做为布尔变 如何量取值)。决策者是做决定时,必须是先回答“是否”?,然后才是回答多少?。 “多少”,只有在“是”的前题下,才能算得上是正确的定量作用。在一个复杂的对局中, 拒绝做出反应(“否”)往往具有重大的策略价值。“沉默费如黄金”!沉默,它有时甚至 是唯一正确的决策。 过去,对快策问题的研究完全忽略了决策的形式逻辑方面的特点,因而研究工作总是局 限在泛函分析的框架之内。今天,只有冲破这个框架,丝毫不因数学上的困难而回避决策问 题的形式逻辑方面的特点,并寻求新的数学工具来概括这些特点。那么,也许决策问题的研 究会因此而出现一个新的局面。 为了突出这一特点,下面举出一个队决策问题的例子。它所涉及的变量、Z、“不是实 型的而是逻辑型的。这个著名的例子是由哈佛大学的何(Y.C.HO)给出的,其背景是一个 军寧协同问题。【) 住在B市的B先生和住在H市的H先生,因为业务上的需要约定于第二天在W市会面, 如果届时W市是晴天的话。从他们约定之后到他们第二天会面之前,由于种种原因他们是不 能直接通讯联系的。当第二天早上B先生和H先生从各自的城市准备出发时,W市的气象情 况是否为晴天完全是一个随机事件。不果他们两人是可以从各自的城市得到当地的气象情 报,而B、H、W三个城市的气象情况又是相关的。他们会面的性质要求,必须是双方在晴 天到达W市为最佳,而一方到达另一方不到,或者双方都到但W市为雨天,这都是不利的。 这可用支付矩阵(狭义的)表示如表1。其 中 , 而且所 有的 ,笋 。 , 而 ,, 。 上式 称为 完善记忆型 信 息结构 【 。 它意味着应 史 上 曾施加 给 系统 的 作用 全部都 提供 做为 当前 的 信 息 。 可 以 证 明 , 线性随机 控 制 的 问 题 就可 以 化成具有这种 信 息结构 的队 决策问题 。 若 将 上式 推广 , 对于所有的 而言 , 只是部 分 的 ,笋 , 当然仍然是 在 , 且 , 。 的 条件下 。 它意 味着 若两个 决 策者存在 着先后 次序关系 , 那 么先行者 知 道 的信 息也 必为 其后 继者所 知道 。 即 七 艺 , , , 这种信息结构称做部分嵌套结构 。 , 〔吕 部分嵌套结 构包括 了相 当广 泛的信息结构类型 , 如 “ 一步 延迟信息共享 ” 结构和 分层” 结构 。 在大系统问 题 中它们 都是典型 的信息结构 。 若 从一个统一的 观 点来看 , 它们 都不过是 部分嵌套结构 的 特例而 巳 。 经 过近二十年的 努力 已经得 出结论 对于 上述所有的 信息结构类型 , 队 决策问题 一 式 的解 丫 都是线性 的 。 〔 , “ 如果 注意到前面 所提到的在控制理论 、 信息论 、 经济管 理 和 军事科学 中的 许多 问题都可 以归结 成 对 一 式求解 , 而 一 式 对于 上述五种信息结 构 的解又都是线性 的 , 那 么应 该 说 通 过队决 策问题 的 研究 , 跨 学科地建立一 个统一 的决策 理论的努力是有 成效的 早 在 年 , 文 献 提 出了建立普 遍 控制理论 的 目标无疑 是卓越 的 、 迷 人的 , 近十年的进 展也是 令人 鼓舞的 。 然而 , 要达到这一 目标 尚须 要跨过一 个未曾被 探索过 的领域 即决 策 的逻 辑蕴 含方面 。 迄今为止 , 决策问题 , 无论是 队决 策问题 也好 , 或者是博奕对策问 题 也好 , 论讨 中所涉及 的 变量 都是做为实变量 来考虑的 。 例如 本文前面所 提到的 息 、 、 集 的元素都是 实变量 , 它们 都在实空 间 、 、 上取 值 。 然而 , 决 策过程远 非如此 简单 。 譬如 说 , 人们 在做出决定 之前 , 首先要 考虑的 不是 “ 应 该 施加 多少作用” , 即 做为实变量 如何取 值 , 而是 首 先要 考虑 “ 是 否应 该 施加 作用” , 即 做为布尔变 如 何量取 值 。 决 策 者是 做决定 时 , 必 须是 先回答 “ 是 否” , 然后才 是 回 答多少 。 “ 多少 ” , 只 有在 “ 是 ” 的前题 下 , 才 能算得 上是 正确的定量 作用 。 在一个复杂的 对局 中 , 拒绝做出反应 “ 否” 往往具 有重 大 的 策略价 值 。 “ 沉默贵如黄 金” 沉默 , 它有时甚 至 是 唯一正确的决 策 。 过去 , 对决 策问 题 的 研 究完全 忽略 了决 策 的形式逻 辑方面 的 特点 , 因而研 究工 作总是局 限在泛 函分 析的 框 架之 内 。 今天 , 只 有 冲破这个 框架 , 丝毫不 因数学 上的 困难而回避决策问 题 的形 式逻 辑方面 的特点 , 并寻求新 的数 学工具来概 括这些 特点 。 那 么 , 也许决 策问题 的 研 究会因此 而 出现一 个新 的 局面 。 为 了突出这一 特点 , 下面 举 出一个队决策问 题 的例 子 。 它所涉及 的 变量 息 、 、 不是实 型的而是逻辑型 的 。 这个著 名的例 子是 由哈佛大学 的何 给 出的 , 其 背景是一个 军事协同问题 。 住在 市的 先生 和住 在 市 的 先生 , 因为 业务 上的 需要 约定于 第二天在 市 会面 , 如果届 时 市是 晴天 的话 。 从他们 约定 之后 到他们 第二天会面 之前 , 由于种 种原因他们是不 能直接 通讯联系 的 。 当第二天早 上 先生 和 先生从各 自的城市 准备出发时 , 市 的气 象情 况 是 否为 晴天 完全是一个随机事件 。 不果 他们 两 人是可 以从 各 自的城市 得 到 当地 的气象情 报 , 而 、 、 三个城市 的气 象情 况 又是相 关的 。 他们 会面 的性 质要求 , 必须是双方在晴 天到达 市为最佳 , 而一 方 到达 另一方 不 到 , 或者双 方都到但 市为雨天 , 这都是 不利的 。 这可 用 支付矩阵 狭义 的 表示如表
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有