决策论 1基本概念 2确定型和不确定型决策 3风险型决策 4马尔科夫决策
1 决策论 1 基本概念 2 确定型和不确定型决策 3 风险型决策 4 马尔科夫决策
1基本概念 o决策, Decision或 Decision Making,是 种对已知目标和方案的选择过程,当人 们已知确定需实现的目标是什么,根据 定的决策准则,在供选方案中做出决策的 过程。 o一门专门研究决策科学的学问形成,称之 为决策科学 o决策科学包括决策心理学、决策的数量化 方法、决策评价以及决策支持系统、决策 自动化等
2 1 基本概念 决策,Decision或Decision Making,是 一种对已知目标和方案的选择过程,当人 们已知确定需实现的目标是什么,根据一 定的决策准则,在供选方案中做出决策的 过程。 一门专门研究决策科学的学问形成,称之 为决策科学。 决策科学包括决策心理学、决策的数量化 方法、决策评价以及决策支持系统、决策 自动化等
通过一例分析决策问题的构成要素 o计划用6个鸡蛋煎饼,现已经向碗 好蛋01坏蛋02 里打了5个鸡蛋,在打第6个鸡蛋前, 有三种不同行动方案可供选择 打入O1 12 a1:向盛有5个好蛋的碗里打第6个鸡 碗里6个蛋煎饼5个好蛋 a 蛋 1 浪费,无 a2:向另一个碗里单独打第6个鸡蛋, 蛋煎饼 以便检査好坏; 单独O21 a3:放弃第6个鸡蛋。 检查6个蛋煎饼,5个蛋煎 a2多洗一个碗饼,多洗 第6个鸡蛋有两种自然状态: 个碗 61:好蛋 62:坏蛋。 丢弃O31 O 32 a35个蛋煎饼,5个蛋煎 各种行动方案在各种不同的自然状态 浪费一个好饼 下会产生不同的结果o 蛋
3 通过一例分析决策问题的构成要素 计划用6个鸡蛋煎饼,现已经向碗 里打了5个鸡蛋,在打第6个鸡蛋前, 有三种不同行动方案可供选择: a1:向盛有5个好蛋的碗里打第6个鸡 蛋; a2:向另一个碗里单独打第6个鸡蛋, 以便检查好坏; a3:放弃第6个鸡蛋。 第6个鸡蛋有两种自然状态: θ1 :好蛋; θ2 :坏蛋。 各种行动方案在各种不同的自然状态 下会产生不同的结果oij: 好蛋θ1 坏蛋θ2 打入 碗里 a1 O11 6个蛋煎饼 O12 5个好蛋 浪费,无 蛋煎饼 单独 检查 a2 O21 6个蛋煎饼, 多洗一个碗 O22 5个蛋煎 饼,多洗 一个碗 丢弃 a3 O31 5个蛋煎饼, 浪费一个好 蛋 O32 5个蛋煎 饼
决策问题构成要素一般为 o决策者 o决策目标 o行动方案 o自然状态 o条件结果值 o决策准则
4 决策问题构成要素一般为 决策者 决策目标 行动方案 自然状态 条件结果值 决策准则
o决策目标指决策者希望达到的状态,工作努力的 目的。一般而言,在管理决策中决策者追求的当 然是利益最大化。 o决策准则决策判断的标准,备选方案的有效性度 量。 o决策属性决策方案的性能、质量参数、特征和约 束,如技术指标、重量、年龄、声誉等,用于评 价它达到目标的程度和水平。 o科学决策过程任何科学决策的形成都必须执行 科学的决策程序。决策最忌讳的就是决策者拍脑 袋决策,只有经历过“预决策→决策→决策后” 个阶段,才有可能产生科学的决策
5 决策目标 指决策者希望达到的状态,工作努力的 目的。一般而言,在管理决策中决策者追求的当 然是利益最大化。 决策准则 决策判断的标准,备选方案的有效性度 量。 决策属性 决策方案的性能、质量参数、特征和约 束,如技术指标、重量、年龄、声誉等,用于评 价它达到目标的程度和水平。 科学决策过程 任何科学决策的形成都必须执行 科学的决策程序。决策最忌讳的就是决策者拍脑 袋决策,只有经历过 “预决策→决策→决策后” 三个阶段,才有可能产生科学的决策
调査研究 确定决策目标 搜集有关的信息资料 预决 预测技术 预测未来的可能情况 拟订各种可行方案 实施情况反馈意见 决策 可行性研究 方案评估 决策准则 方案选择 方案实施 决策后 科学决策过程
6 调查研究 确定决策目标 搜集有关的信息资料 预测技术 预测未来的可能情况 拟订各种可行方案 可行性研究 方案评估 决策准则 方案选择 方案实施 预决策决策 实施情况反馈意见 决策后 科学决策过程
o决策系统 o(1)状态空间S o(2)策略空间U o(3)损益函数V o决策系统可以表示为三个主要素的函数: D=DSU v
7 决策系统 (1)状态空间S (2)策略空间U (3)损益函数V 决策系统可以表示为三个主要素的函数: D=D(S, U, V)
o状态空间是指不以人的意志为转移的客观 因素,设一个状态为Si,有m种不同状态, 其集合记为: S={S12S2,S3…,Sm}={S}i=1,m oS称状态空间;S的元素S/称为状态变量
8 状态空间 是指不以人的意志为转移的客观 因素,设一个状态为Si,有m种不同状态, 其集合记为: S称状态空间;S的元素Si称为状态变量。 S = {S1 , S2 , S3 , Sm } = {Si } i =1, m
o策略空间是指人们根据不同的客观情况, 可能做出主观的选择,记一种策略方案为 Ui,有n种不同的策略,其集合 u 1:112 n oU称为策略空间;U的元素U/称为决策变
9 策略空间 是指人们根据不同的客观情况, 可能做出主观的选择,记一种策略方案为 Ui,有n种不同的策略,其集合 U称为策略空间;U的元素Uj称为决策变 量。 U = {u1 ,u2 , ,un } = {u j } j = 1, ,n
o损益函数是指当状态处在S情况下,人 门做出U决策,从而产生的损益值∨j,显 然V是Si,U的函数,即 Vn=v(S,l/)i=12,…m,j=1,2,…n o当状态变量是离散型变量时,损益值构成 的矩阵叫损益矩阵。 V(S, Up YS,, L V(S,U V(S2,U2)V(S2J2) V(Sm,U V(Sm, u2)
10 损益函数 是指当状态处在Si情况下,人 们做出Uj决策,从而产生的损益值Vij,显 然Vij是Si,Uj的函数,即 当状态变量是离散型变量时,损益值构成 的矩阵叫损益矩阵。 Vi j = v(Si ,u j ) i = 1,2, m; j = 1,2, n = = ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( ) 1 2 2 2 2 2 2 1 1 1 2 1 m m m n n n i j m n V S U V S U V S U V S U V S U V S U V S U V S U V S U V V