第8卷第2期sn101053x.1936老0紧科技大学学报 Vol.18 No.2 19964 Journal of University of Science and Technology Beijing Apr.1996 基于设备诊断的多目标马尔柯夫决策规划 范玉妹) 徐金梧陈克兴) 尹红婷高立新 )北京科技大学数力系,北京100083 2)北京科技大学机械工程学院 摘要从技术和经济两个方面综合考虑,用多目标马尔柯夫规划解决设备诊断与决策的连接问 题,给出了一个数值仿真实例. 关键词故障检测,多目标,马尔柯夫决策 中图分类号TH165.3.0221.5 目前,国内外诊断领域的大多数研究者都集中精力于设备诊断的各种技术、仪器以及对 特定设备诊断等方面的研究),而对诊断与决策二者的综合研究甚少,因而使得二者相交的 领域成为一个相当薄弱的环节. 本文试图采用多目标马尔柯夫决策规划(Multiple Objective Markov Decision Programing, 以下简称MOMDP)解决诊断与决策的连接问题,将机床(设备)诊断与生产及维修活动的各 个方面有机地连接起来,从技术和经济两个方面综合考察设备活动、从而作出最佳维修决策, 1折扣MOMDP 1.1定义 折扣MOMDP由五重组{S,(A(,ieS),q,,所构成,其中: (1)S是非空可列集,为系统的状态集, (2)A()是非空可列集,为系统处于状态1时的可用决策集, (3)对每个t≥0,令h,(,a,i,a1,…,i,a,ieS,aeA()n=l,2,…,t称之为系 统直到t时刻的一个“历史”,全体如此历史之集记作H. q是一族时间上齐次的马氏转移律,即任给h-eH,-,,∈S,a∈A(),有qh-,,a)= pjji,a)任给jS,t=0,1,2,…,其中h-,代表无历史,qUli,a)表示处于状态i,采取决策a, 下一步转移到状态j的概率. (4)r是T={(,a吵:i∈S,a∈A()}上的P维实向量值函数,称为“报酬函数”. i,a四=[ri,ari,a,,ri,a明 (⑤)系统要求在各个时刻点上选取决策,一个策略是一个决策序列π=(π。,兀1,兀2,·方π, 表示t时刻采取决策的规则,它对任意给定的t≥0,h-,∈H-,1∈S,是A(,)上的一个概 率分布,π(h-,,)表示采用策略π时,系统历史h-已发生,而在t时刻处于状态i的 条件下,采用决策a的概率.全体策略记作 1994-01一18收稿第一作者女48岁副教授 ·高校博上学科点专项科研基金资助项目
第 卷 第 期 北 京 科 技 大 学 学 报 姚年 月 心 翔巧 基于 设备诊 断的多 目标马 尔柯夫决策规划 ’ 范玉 妹 ’ 徐金 梧 陈克兴 尹 红 婷 ’ 高 立 新 北 京科 技大 学 数力系 , 北 京 以幻 北 京科技大 学机械工 程 学 院 摘要 从技术和 经济两个方 面 综合考虑 , 用 多 目标马尔柯 夫规 划 解 决 设 备诊 断 与 决 策 的 连 接 问 题 , 给 出 了一个数值仿真实例 关键词 故 障检测 , 多 目标 , 马 尔柯夫决策 中图分类号 , , 目前 , 国 内外 诊 断领 域 的大 多数研究 者 都集 中精 力于 设 备诊 断 的各种技术 、 仪 器 以 及 对 特定设备诊 断等方 面 的研 究, , 而 对诊 断 与决策二者 的综合研 究甚 少 , 因而 使 得 二 者 相 交 的 领域成 为一个相 当薄 弱 的环节 本文试 图采 用 多 目标 马尔柯 夫决策规划 叭 , 以下 简称 解 决诊 断与决策 的连接 问题 , 将机 床 设 备 诊 断 与生产 及 维修 活 动 的各 个方 面有 机地 连接起来 , 从 技术 和 经济 两个方 面 综合考 察设备活动 , 从而 作 出最 佳 维 修决策 折扣 定 义 折扣 由五 重组 , , 任 , 叮 , , 所构成 , 其 中 是 非 空 可列集 , 为系 统 的状态集 双 是非 空 可 列集 , 为 系 统处于 状态 时 的可 用决策集 对每 个 , 令 , 。 , 。 , , , , … , ,, ‘ , 沂 , 。 。 , , , … , 称之为系 统直到 时刻 的一个 “ 历史 ” , 全体 如此历史 之 集 记作且 是 一族 时 间上 齐次 的马氏转移律 , 即任给 气 一 沂 城 一 , ‘ , 任 , , 有 朗气 一 , 毛 , 幼二 关 , , 任给 〔 , , , , … , 其 中 气 一 ,代表无历史 , 创 , 表示处于状态 , 采取 决策 , 下 一步 转移 到状态 的概 率 是 二 , 任 , “ 〔 上 的 维 实 向量值 函 数 , 称 为 “ 报酬 函 数 ” 代 , , , 几 , ,二 ‘ , , 系 统要求在各个时刻点上选取决策 , 一个策略是 一个决策序列 二 二 。 , 二 , , 二 , … , 二 ‘ 表示 时刻采取决策 的规则 , 它对任 意 给定 的 , 气 ,‘ 城 , ‘ 任 , 是 上 的一个 概 率分布 , 二 气 一 , 表示 采 用 策 略 二 时 , 系 统历 史 气 一 ,已 发 生 , 而 在 时 刻 处于 状 态 人的 条件下 , 采用 决策 。 的概率 全 体策 略记作 望玛 一 一 收稿 第 一 作 者 女 铭 岁 副教 授 高校博士 学科 点 专项科研 基金 资助 项 目 DOI :10.13374/j .issn1001-053x.1996.02.020
Vol.18 No.2 范玉妹等:基于设备诊断的多目标马尔柯夫决策规划 193. 若f是定义在S上的映射,)∈A(,iES,则称∫为一个“决策函数”,其全体记作F. 若π=(f,1,f2、,其中厂∈F,t=0,12,,则称π为一个马氏策略,其全体记作日:若元 =,)∫,),其中∫∈F,则称π为一个平稳策略,并记π=,全体平稳策略记作,显然 正cc门.用Y,△t分别表示t时刻系统所处的状态和选取的决策,给定π∈∏后,令(π) =(Y。,A,Y,A、)对Lπ)定义泛函过程 Rm=Rm(π)=rn(Y,△)t≥01≤m>P R,=R,(π)=r(Y,△)=[r(Y,△),r2(Y,△,,r(Y.△】t≥0 定义Vm为I×S上的函数 V.a,0=E以B%RY=i}0≤B.<1 式中:B=(B,月2,…,f。)0≤fm<1,m=1,2,…,p; B·R,=[B(Y,△,5(Y△),%r,(Y,△〗 显然V(π,)=[V(m,,V(π,,…,V(π,i月. V称为系统的折扣目标函数,V的第m个分量Vm称为第m个折扣目标函数;B称为折 扣因子,B的第m个分量Bm称为第m个目标函数的折扣因子, 折扣MOMDP,就是对给定的系统初始状态i,在给定的策略范围2(CI)内,求策略 π(∈2)使系统的目标函数值最大,即: (VP)maxV(π,i) (1) xE 在折扣MOMDP中,如果V中各目标函数的折扣因子相同,即B1=B2=…=B。则称V 为齐折扣目标函数,相应的折扣MOMDP称为齐折扣MOMDP. 当P=1时,式(1)是单目标规划 (P)maxV(π,i) (2) x∈0 称式(2)为“折扣马氏决策规划”(Discounted Markov Decision Programing简记为MDP);折 扣MDP中,若报酬函数r与时间t有关,则称为报酬函数与时间有关的折扣MDP.本文先讨 论齐折扣目标并给出仿真计算,进而讨论折扣目标. 12线性加权法 当P=1时,(VP)(I)是单目标规划(P)(2),它的最优解元也称为MDP的“最优策略”,最 优值Vπ,)也称为MDP的“最优报酬”. 对不同的状态i,MDP是不同的,因此元往往也是随着i不同而异的,若e2对任何i∈S 均是MDP的最优策略,即元是一系列规划: ((P)maxV(n,i):ieS xEO 的共同的最优策略,则称元为MDP的“全局最优策略”(或“全局最优解”),称Vπ)=(V(π, 1),V(π,2),…)T为MDP的“全局最优报酬向量”(或“全局最优值向量”). 当P≠1(即多目标)时,可以将(VP)(1)用求解单目标规划 (P)mV(π,i)2T (3)
范 玉 妹等 基 于 设备诊断的多 目标马 尔柯夫决策规划 · · 若 了是 定义在 上 的映射 , 任 , 汪 , 则 称 为一 个 “ 决 策 函 数 ” , 其 全 体记 作 若 二 二 认 , , , 儿 , … , 其 中 关 〔 , , , … , 则称 二 为一个马氏策略 , 其全俐己作 凡 若 二 以 , , 二 , 其 中 任 , 则称 兀 为一个 平稳 策 略 , 并记 二 ‘ , 全体平稳策略记作 几 显然 几 二 众二 用 ‘ , △ 分别表示 时刻系统所处 的状态和 选取 的决策 , 给定 二 。 后 , , 令 你 戊 , , , △ , … , 对 以动 定 义泛 函过 程 罗 尸“ , , △ ‘ ‘ 二 ,,△ ‘ 【 , △ , ‘ ,△ ‘ 簇 , ‘ , △ , 』 定 义 , 为 上 的 函数 礁 二 , 一 艺刀从尺 少 。 一 毛焦 式 中 刀 叨 , 几 , … , 刀 蕊刀 二 , 阴 , , “ ‘ , 尸 声 ‘ · 刀 , △ ‘ , 口 , △ ‘ , … , 刀 , △ ‘ · 显然 二 , 私 二 , , 矶 二 , , … , 叭 二 , · 称 为系 统 的折扣 目标 函数 , 的第 。 个分量 二 称 为第 。 个折扣 目标 函数 刀称 为折 扣 因子 , 声的第 个分量 刀 , 称 为第 个 目标 函数 的折扣 因子 折扣 , 就是 对给定 的系 统初 始状态 , 在给定 的策略范 围 。 内 , 求策 略 兀 使 系 统 的 目标 函 数值最 大 , 即 二 , 在 折扣 中 , 如果 中各 目标函数的折扣 因子相 同 , 即 口 刀 一刀 , 为 齐折扣 目标 函数 , 相 应 的折扣 称 为 齐折扣 当 二 时 , 式 是单 目标规划 二 , 则 称 称式 为 “ 折 扣 马 氏决 策 规划 ” 回 而 简记 为 折 扣 中 , 若报酬 函数 与时间 有关 , 则称为报酬函数与时 间有 关 的折扣 本文先讨 论 齐折扣 目标并 给 出仿真计算 , 进而 讨 论折扣 目标 线性加权法 当 尸 时 , ’ 是 单 目标规划 , 它 的最优解 讨 也称 为 的 “ 最 优策 略 ” , 最 优值 澎 , 也称 为 的 “ 最优 报酬 ” 对不 同的状态 , 是 不 同的 , 因此 记 往往也是 随着 不同而异的 若辰 对例可 〔 均是 的最优策 略 , 即 元 是 一 系列规划 万 、 兀 、 飞 〔 的共 同 的最 优 策 略 , 则 称 万 为 的 “ 全 局 最 优策 略 ” 或 “ 全局 最 优解 ” , 称 碱叉 二 兀 , 元 , … 为 的 “ 全 局 最 优 报酬 向量 ” 或 “ 全 局 最 优 值 向量 ” 当尸 羊 即多 目标 时 , 可 以将 用求解单 目标规划 二 , 又 任
.194 北京科技大学学报 19%年No.2 来代替,其中1=(,12,,,MT表示1的转置,实数人m称为第m(m∈M0个目标的权因 )r=三入,V.(π,).可以把(P(3)的最优 若式(3)有最优解元,则称元为(从状态i出发的)MOMDP在权1下的“线性加权最 优策略(解)”;V(π,)AT称为(从i出发的)MOMDP在权1下的线性加权最优报酬值”;若 元是任何一个从i出发的MOMDP在权1下的线性加权最优策略,则称元为MOMDP在权入 下的“全局线性加权最优策略(解)”;称(V(π,I)AT,V(阮,2),Y为MOMDP在权1下的“全局 线性加权最优报酬(值)向量”. (1)齐折扣目标 定理1如果V是齐折扣目标,共同的折扣因子为B,则MOMDP(VP)(I)的线加权规划 (P)(3)与五重组{S,(D②,i∈S,q,r1T,V)决定的MDP (登(,) (4 是相同的,五重组中(r)(i,d)=上化d),V是折扣因子为B的折扣目标函数. m1 对于齐折扣目标,它的策略求值运算公式为: 0-含+吗400m ie S,mEM (2)折扣目标 定理2如果V为折扣目标,第m个目标的折扣因子为Bm,则MOMDP(WPI)的线性 加权规划(P)(3)与下面规划相同 (Pmr"',) (5) 该规划是由五重组{S,(D,ie),9,r,V"决定的,它的报酬函数是与时间有关的MDP,其中 )=上(Bn例元r,B=maxB,B,f,}<1,V'是折扣因子为B的折扣目标函数. 定理3如果V为折扣目标,第m个目标的折扣因子为Bm,则MOMDP(VPX)的线性加权 规划(P)(3)与下面规化相同 (P)maxV"(π,) (6 该规划是由五重组{S,(A),i∈S,9,r,V'?决定的,它的报酬函数与时间有关的MDP,其中 利=∑An,B=1,An=B%,V“是折扣因子为1的折扣单目标. 定理2和定理3说明,折扣目标既可看作折扣因子为B的单目标,又可看作折扣因子为1 的单目标, 定理2说明存在最优马氏策略和确定在应用计算时的段数T,定理3是为了用类似有限 阶段模型的方法求解最优马氏策略.折扣多目标线性加权法的步骤如下: 步骤1.求有限阶段模型所需要的时间段数T T=ln[(1-)/2M]·(lnB)-'+1} (7) 式中:B=max{B,B2,…,B。},m=l,2,,p;M=max{M,M2,,M,},Mm是tm的任 一上界,ε是决策者所选取的一个计算精度值.e大(取0.01),则T就小;如小(0.00001)
北 京 科 技 大 学 学 报 来代替 , 子 , 一般 又 以 , 又 ,… , 又,又 表示 又 的转置 , 实数 又。 称 为第 塑灭 年 心 任 间 个 目标 的权 因 礼 , 兀 , 厂 艺又。 二 二 , 可 以把 的最优 解作为 尸 的最优解 其有宁自中 若式 有 最优解 觉 , 则 称 充 为 从 状 态 出 发 的 在 权 又 下 的 “ 线 性 加 权 最 优 策 略 解 ” 二 , 又 称 为 从 出发 的 在 权 又 下 的线性 加权最优报酬值 ” 若 而是 任何一个从 出发 的 在 权 又 下 的线性加权最 优策略 , 则称 万 为 在权人 下 的 “ 全局 线性加 权最优策 略 解 ” 称 伪 , 琳爪 元 尸,’ · 了为 在权 又下的 “ 全局 线性 加权最 优报酬 值 向量 ” 齐折扣 目标 定 理 如果 是 齐折扣 目标 , 共同的折扣 因子为 吞 , 则 乃 的 线 加 权 规 划 与五 重组 , , ‘ , , 又 , 决定 的 尹 黔’ 几 ’ 是相 同的 , 五 重组 中 厂 , 艺弋‘ , , ’ 是折扣 因子 为 刀的折扣 目标 函 数 对于 齐折 扣 目标 , 它 的策略求值运算公式 为 艺弋‘ 辽 , 人 , 任 , 任 折 扣 目标 定理 如果 为折扣 目标 , 第 个 目标 的折扣 因子 为 刀 , 则 乃 的 线性 加权规划 与下 面规划相 同 黔 ’ ‘恤 , 该规划是 由五重组毛 , , 汪 习 , , , “ 决定 的 , 它 的 报酬 函数 是与时间有关的 , 其中 窄匹 衍 。 , “ 一 孤 凡 … 砌 , , 俨 是折扣 因 子 为 “ 的折扣 目标 函 数 · 定理 如果 为折扣 目标 , 第 个 目标 的折扣 因子 为 口 , 则 的线性加权 规划 与下 面规化相 同 俨,二 , 〔 该规划是 由五 重组 , 闰 , 二 艺弋态 , 刀 , , 风 偏 任 , , , ‘今决定 的 , 它的报酬 函数与时间有关的 , ,’ 是 折 扣 因子 为 的折扣单 目标 定 理 和定 理 说 明 , 折扣 目标 既可看作折扣 因子为 刀的单 目标 , 又可看作折扣 因子 为 的单 目标 定理 说 明存 在最优 马 氏策 略和 确 定在应用计算 时 的段 数 双 定理 是 为 了用类似有 限 阶段模 型 的方法 求解 最优 马 氏策略 折扣多 目标线性加权法 的步骤 如下 步骤 求有 限 阶段模型所需 要 的时间段数 一 刀 · 刀 一 ’ 式 中 刀一 伊 , ,吞 , … ,刀 , , , , … , ,, , … , , , 。 是 , 的 任 一 上 界 , 。 是决 策 者 所 选 取 的一个计算精度值 一 大 取 , 则 就小 如 列 、 取
Vol.18 No.2 范玉妹等:基于设备诊斯的多目标马尔柯夫决策规划 .195. 计算精度越高,则T要多取几段. 步骤2.用动态规划法(向前或向后均可)计算T阶段的最优马氏策略π*T 令: +'=0,jeS (8) 对: t=T,T-1,,1,0,并令: .)=max[∑B5rm(i,d)+∑0ji,d)'U] =∑nBr(i,(i)+∑q0i,():'(),i,jeS,meM(9) *'表示在阶段t,从状态i出发,在余下的T+I一t阶段用最优策略的期望总报酬 步骤3.将步骤2求得的π*T延拓成任何时段都有决策的策略π*.延拓方法是:(1)当t ≤T时,π*的决策同πT;(2)当1>T时,π*决策任取(注意到π当t>T时,没有决策.) 可见,步骤2求出的π7就是折扣多目标线性加权解法的一个ε最优策略π* 2齐折扣多目标线性加权解法的仿真运算 通过11个方面(主要是设备诊断技术)评定生产精密机床的工作母机的工作状态问,得 到维修措施下的状态转移概率q(:,d).第t时段的维修费支出r:(d)(目标一是使支出费用最 小)和第t时段的收益(,)(目标二是使收益最大),如表1所示.其余参数均可从现场采集经 过整理而得到. 表1仿真运算数据 状态行动 转移概率q/,d) 报酬/元 i d j=1 产2 j=3 j=4 r低 r6,d) 1 a 0.845 0.075 0.048 0.032 0 2155 a 0.000 0.608 0.350 0.041 0 1645 2 b 0.769 0.107 0.049 0.048 -285 1645 c 0.802 0.103 0.048 0.045 -2341 1645 0.000 0.000 0.849 0.151 0 1316 6 0.646 0.165 0.134 0.053 -285 1316 0.672 0.153 0.120 0.052 -2341 1316 0.000 0.000 0.000 1.000 0 1020 b 0.248 0.308 0.323 0.119 -285 1020 0.412 0.224 0.252 0.110 -2341 1020 取以下二组不同的权系数:()支出权系数入,=0.8,收益权系数12=0.2;(2)支出权系数 11=02,收益权系数2=0.8.计算结果见表2. 由表2可见,当1,=0.8,12=0.2时,最优决策只有一个;而当1,=02,12=0.8时,最 优决策有二个,这与决策者的意图是一致的,也说明MOMDP的优越性.取,=O.8,说明决策 者十分重视支出的费用(如企业经营状况欠佳,无力支付维修费用等),此时所选的维修策略 一般较少;取1,=0.8、表明决策者更看重机床所带来的收益,此时,有二种维修策略可供选 择,若从此表来看,则取决策好,但若考虑其它因素(如人员、备件等资源),亦有可能取g决策
范玉 妹等 基 于 设备诊断的多 目标马尔柯夫决策规划 计算精度 越 高 , 则 要多 取几段 步 骤 用 动态规划 法 向前 或 向后均 可 计算 阶段 的最 优 马 氏策略 二 令 砰 ’ 兰 , ‘ 对 , 一 , , , , 并令 ’ 一 艺义 二 刀盆 , , 己 艺仃 , 一 艺又。 刀盆 , 艺、 仃 , 关 、 用 ‘ ’幼』 ‘ ’仃 , , ‘ , 任 砰 ’ 表示 在 阶段 , 从状态 出发 , 在余下 的 一 阶段 用最优策 略 的期望 总报酬 步骤 将步骤 求得 的 二 延 拓成任何 时段 都有决策 的策略 二 延 拓 方 法 是 当 蕊 时 , 的决 策 同 二 ’几 当 时 , 二 决 策任取 注意 到 ’ 当 时 , 没有 决策 可见 , 步骤 求 出的 二 ‘ 了就是 折扣 多 目标 线性 加权解 法 的一个 。 最优策略 齐折扣 多 目标线性加权解法 的仿真运 算 通 过 个方 面 主要 是设备诊 断技 术 评 定 生产精 密 机 床 的工 作 母 机 的 工 作 状 态 阎, 得 到 维修措施下 的状态转移概 率 切 , , 第 时 段 的 维 修 费 支 出 目标一是使支出费用最 小 和第 时段 的收益 , 目标二是使收益最大 , 如表 所示 其余参数均可从现场采集经 过整理而 得到 表 仿真运 算数据 状态 行动 转移概率 价 , 内 报酬 元 , , 卫铭 以 日粥 印 供 麟 以 《润旧 一 研 只 供 一 研 刃 《 刃 一 斜 〔训石 一 一 《 刃 以 联】 洲 引 一 加 一 取 以 下 二组 不 同的权系数 支出权系数 又 名 , 收益权 系数 元 支 出权 系数 又、 二 , 收益权 系数 又 计算结果见 表 由表 可见 , 当 又,二 , 又 时 , 最优决策只有一个 而 当 又, , 又 时 , 最 优决策有二个 这 与决策者的意 图是一致 的 , 也说明 的优越性 取 又 , 说明决策 者 十分 重视支 出的费用 如企 业 经 营状况欠佳 , 无力 支付维修费用等 , 此 时所 选 的 维修 策 略 一般较 少 取 又 二 , 表 明决策者 更看重机床所带来的收益 , 此时 , 有二 种 维修策略可供 选 择 , 若从此表来看 , 则取 决策好 , 但若考虑其它因素 如人员 、 剖牛等资源 , 亦有可能 取 决策
.196. 北京科技大学学报 199%年No.2 表2计算结果 11=0.8 决策 a b b b 2=0.2 收益 48723 4837348243 47996 决策f a b b b 1=0.2 收益f 218170 217673217300216736 42=0.8 决策g a b b b 收益g 205605204110204634203891 3结论 (1)对于劣化(故障)随机发生的一类设备,应用MDP不要求知道设备劣化(故障)的概 率分布,只要有反映设备劣化(故障)的状态转移概率即可,而这些数据现场是容易获得的, (2)MDP得到的结果与现代机床的维修原则是完全一致的,即:决策维修活动时,不能只 看到所支出的费用,更应看到现代机床通过维修后,可以改善设备的状态,从而为企业创造更 大的利润. (3)MDP的数学条件是比较严格的,不同指标的选择对MDP模型计算结果的真实性 和实用性影响很大,因此,需要在合理确定状态指标方面慎重考虑, 参考文献 1 Jewell W S.Markov-Renewal Programming(I):Formulation,Finite Return Models.Operation Research, 1963.11:938~948 2 Jewell W S.Markov-Renewal Programming (II )Infinite Return Models,Example.Operation Research, 1963,11:949~971 3现代工程数学手册编委会,现代工程数学手册(第Ⅳ卷).武汉:华中工学院出版社,1987.173~1235 4曾庆宁.折扣多目标马尔可夫决策规划:[学位论文].西安:西北电讯工程学院,1986 5高立新,金属切割机床智能监控系统的研究:学位论文].北京:北京科技大学,1995 Mul-objective Markov Decision Programic Based on Equipment Diagnosis Fan Yumei Xu Junwu?Chen Kexing2 Yin Hongting Gao Lixin? 1)Department of Mathematics and Mechanics.USTB.Beijing 100083,PRC 2)Department of Mochanical Engineering.USTB ABSTRACT Considering of the influence of technology and economic,the joining between the equipment diagnosis and decision is solved by using the mul-objective Markov decision, and a simulating example about the mechine is presented. KEY WORDS fault detection,mul tiple objective,markovian decision
北 京 科 技 大 学 学 报 天 年 表 计算结果 入 凡 决策 收益 决策 收益 决策 收益 凡 凡二 引刀 望拓 印 以 叫 结论 对于 劣 化 故 障 随机发 生 的一类设 备 , 应用 不 要 求 知 道 设 备 劣 化 故 障 的概 率分布 , 只要 有反 映设备劣 化 故 障 的 状 态 转移概 率 即可 , 而 这些 数据现场是容易获得 的 , 得 到的结果与现代机床的维修原则是完全一致的 , 即 决策 维修活动 时 , 不 能只 看 到所支 出的费用 , 更应看到现代机床通过维修后 , 可 以改善设备的状态 , 从而 为企 业创造 更 大 的利 润 的数学条件是 比较严 格 的 , 不 同指 标 的 选 择 对 模 型 计 算 结 果 的真 实性 和 实用性 影 响很 大 , 因此 , 需要 在合理 确定状态指标方 面慎重 考虑 参 考 文 献 亡叭吧 一 翔 工 以由 , 而 , , 一 叭尼 一 卫 几 们 丘 切爪 加 , 公 山 , , 叫 一 卯 现代工 程数学手册编 委 会 现代工 程 数学 手册 第 卷 武汉 华 中工 学 院 出版社 , 一 曾庆宁 折扣 多 目标 马尔可 夫 决策规划 【学 的仑文」西安 西北 电讯工 程 学 院 , 高立新 金 属切割机床智能监控系统的研究 学位论文 北京 北京科技大学 , 卯 一 兄 而 川韶 己龙 。 ” 叩 叭 坦 “ 翻“ , , 一 洲粥 , 。 「 仪 司 吧 已 , 山 枉£ 助 而 , 认 位 一 呱 晰 , 丫℃ 泛℃ 抚 巧 。 ,