第12卷第2期 智能系统学报 Vol.12 No.2 2017年4月 CAAI Transactions on Intelligent Systems Apr.2017 D0I:10.11992/6is.201508012 网络出版地址:http://www.cnki.net/kcms/detail/23.1538.tp.20170217.0954.002.html 企业、政府与公众公共健康提升激励机制演化分析 曲卫华12,颜志军3 (1.太原学院计算中心,山西太原030032:2.山西大学管理与决策研究中心,山西太原030006:3.北京理工大学 管理与经济学院,北京100081) 摘要:我国能源消费导致的环境污染严重影响公众的公共健康水平。在考虑公众公共健康损失赔偿的情况下,构 建了企业、政府与公众的三方演化博弈模型以分析三方策略的选择机制及影响因素。演化博弈理论认为在三维空 间区域内,三方没有收敛于某一结果的演化稳定策略。研究发现,在一定条件下,在三维空间的某一区域内,三方可 收敛到理想的演化博弈稳定策略:{实行能源转型、企业监管、公众参与环境管理}。并用数值仿真展示了在理想演 化博弈稳定策略情景下,不同政策决策参数对演化结果的影响。研究结果表明,在政府群体实行监管比例固定的条 件下,公众群体参与环境管理比例越大或公众公共健康损失赔偿越大,企业群体演化与实行能源转型策略的速度越 快。同时,讨论了政府补贴、税收减免、政府罚款对演化结果的影响,提出了相应的政策建议。 关键词:能源消费:企业污染:政府监管:公众参与:博弈 中图分类号:TP3;062.2:C93文献标志码:A文章编号:1673-4785(2017)02-0237-07 中文引用格式:曲卫华,颜志军.企业、政府与公众公共健康提升激励机制演化分析[J].智能系统学报,2017,12(2):237-249. 英文引用格式:QU Weihua,YAN Zhijun.Evolutionary analysis of incentive mechanisms for enterprises,governments,and the public to achieve environmental health improvements[J].CAAI transactions on intelligent systems,2017,12(2):237-249. Evolutionary analysis of incentive mechanisms for enterprises,governments, and the public to achieve environmental health improvements QU Weihua2,YAN Zhijun (1.Computer Center,Taiyuan University,Taiyuan 030032,China;2.Institute of Management and Decision,Shanxi University, Taiyuan 030006,China;3.School of Management and Economics,Beijing Institute of Technology,Beijing 100081,China) Abstract:The effects environmental pollution caused by energy consumption are having on public health in China are quickly becoming increasingly serious.In this paper,we establish an evolutionary game model for enterprises, governments,and the public to analyze selection mechanisms and impact factors of these three constituents,thus considering health damage compensation.From game theory,these three stakeholders fail to converge to an ideal evolutionary stable strategy in some domains of the given three-dimensional space:however,we have found that, under certain conditions,these three stakeholders can converge to an ideal evolutionary stable strategy in certain domains,i.e.,implementing energy transformation,enterprise regulation,and public participation in environment control.We show the effects that the variety of decision-making parameters have on evolutionary results via numeri- cal experiments.We found that when the proportion of influence that the government group exercises in terms of reg- ulations remains fixed,the higher the proportion of public participation in environmental management(and there- fore higher health damage compensation)and the faster the speed by which the enterprise group evolves and energy transformation is realized.We also discuss the effects that government subsidies,tax deductions and exemptions, and government fines have on the evolutionary results,making some suggestions for policymakers as part of our con- clusions. Keywords:energy consumption;enterprise pollution;government regulation;public participation;game theory 我国以煤炭为主的化石能源消费产生了大量危氧化合物、悬浮颗粒物(TS)、颗粒物(PI0)、细颗 害公共健康的污染物,包括二氧化硫、烟尘、粉尘、氨 粒物(PM2.5)等,这些污染物是引发雾霾天气的主 要原因口,对呼吸系统疾病、心脑血管疾病等公共 收稿日期:2015-08-13.网络出版日期:2017-02-17. 健康水平有严重威胁。研究表明,由2013年1月的 基金项目:北京市自然科学基金项目(9152015). 通信作者:颜志军E-mail:yanzhijun(@bit.cdu.cn. 雾霾天气导致的健康经济损失总额约为226亿元
第 12 卷第 2 期 智 能 系 统 学 报 Vol.12 №.2 2017 年 4 月 CAAI Transactions on Intelligent Systems Apr. 2017 DOI:10.11992 / tis.201508012 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.tp.20170217.0954.002.html 企业、政府与公众公共健康提升激励机制演化分析 曲卫华1,2 ,颜志军3 (1. 太原学院 计算中心,山西 太原 030032; 2. 山西大学 管理与决策研究中心,山西 太原 030006; 3.北京理工大学 管理与经济学院,北京 100081) 摘 要:我国能源消费导致的环境污染严重影响公众的公共健康水平。 在考虑公众公共健康损失赔偿的情况下,构 建了企业、政府与公众的三方演化博弈模型以分析三方策略的选择机制及影响因素。 演化博弈理论认为在三维空 间区域内,三方没有收敛于某一结果的演化稳定策略。 研究发现,在一定条件下,在三维空间的某一区域内,三方可 收敛到理想的演化博弈稳定策略:{实行能源转型、企业监管、公众参与环境管理}。 并用数值仿真展示了在理想演 化博弈稳定策略情景下,不同政策决策参数对演化结果的影响。 研究结果表明,在政府群体实行监管比例固定的条 件下,公众群体参与环境管理比例越大或公众公共健康损失赔偿越大,企业群体演化与实行能源转型策略的速度越 快。 同时,讨论了政府补贴、税收减免、政府罚款对演化结果的影响,提出了相应的政策建议。 关键词:能源消费;企业污染; 政府监管;公众参与;博弈 中图分类号: TP3; 062.2; C93 文献标志码:A 文章编号:1673-4785(2017)02-0237-07 中文引用格式:曲卫华,颜志军. 企业、政府与公众公共健康提升激励机制演化分析[J]. 智能系统学报, 2017, 12(2): 237-249. 英文引用格式:QU Weihua, YAN Zhijun. Evolutionary analysis of incentive mechanisms for enterprises, governments, and the public to achieve environmental health improvements[J]. CAAI transactions on intelligent systems, 2017, 12(2): 237-249. Evolutionary analysis of incentive mechanisms for enterprises, governments, and the public to achieve environmental health improvements QU Weihua 1,2 , YAN Zhijun 3 (1.Computer Center, Taiyuan University, Taiyuan 030032, China; 2. Institute of Management and Decision, Shanxi University, Taiyuan 030006, China; 3.School of Management and Economics, Beijing Institute of Technology, Beijing 100081, China) Abstract:The effects environmental pollution caused by energy consumption are having on public health in China are quickly becoming increasingly serious. In this paper, we establish an evolutionary game model for enterprises, governments, and the public to analyze selection mechanisms and impact factors of these three constituents, thus considering health damage compensation. From game theory, these three stakeholders fail to converge to an ideal evolutionary stable strategy in some domains of the given three⁃dimensional space; however, we have found that, under certain conditions, these three stakeholders can converge to an ideal evolutionary stable strategy in certain domains, i.e., implementing energy transformation, enterprise regulation, and public participation in environment control. We show the effects that the variety of decision⁃making parameters have on evolutionary results via numeri⁃ cal experiments. We found that when the proportion of influence that the government group exercises in terms of reg⁃ ulations remains fixed, the higher the proportion of public participation in environmental management (and there⁃ fore higher health damage compensation) and the faster the speed by which the enterprise group evolves and energy transformation is realized. We also discuss the effects that government subsidies, tax deductions and exemptions, and government fines have on the evolutionary results, making some suggestions for policymakers as part of our con⁃ clusions. Keywords: energy consumption; enterprise pollution; government regulation; public participation; game theory 收稿日期:2015-08-13. 网络出版日期:2017-02-17. 基金项目:北京市自然科学基金项目(9152015). 通信作者:颜志军.E⁃mail: yanzhijun@ bit.edu.cn. 我国以煤炭为主的化石能源消费产生了大量危 害公共健康的污染物,包括二氧化硫、烟尘、粉尘、氮 氧化合物、悬浮颗粒物(TSP)、颗粒物(PM10)、细颗 粒物(PM2.5)等,这些污染物是引发雾霾天气的主 要原因[1] ,对呼吸系统疾病、心脑血管疾病等公共 健康水平有严重威胁。 研究表明,由 2013 年 1 月的 雾霾天气导致的健康经济损失总额约为 226 亿元
·238 智能系统学报 第12卷 相当于2011年平均月度卫生总费用的11.2%2】。 企业与公众的两方博弈研究,对于政府、企业与公众 现有文献主要从健康经济损失、政府监管和公 三方博弈的相关研究比较少:2)在研究方法上,大多 众参与等几个角度研究企业、政府和公众三方的能 数研究主要采用暴露响应与剂量效应原理的解析法 源消费、环境保护与公共健康问题。1)从健康经济 或仅研究企业排污与政府监控、企业排污与公众参与 损失角度来看,Xa等)通过对我国30个省份环境 的两方博弈,未综合考虑企业能源转型、政府监管与 污染物导致的公众健康经济损失研究,使用投入产 公众参与环境三者的动态机理,而公众参与行为对政 出方法表明,2007年,由环境污染造成的公众公共 府监管力度与企业排污程度有重要影响:3)在数值仿 健康损失大约为3460亿元;Wang)研究了我国不 真方面,现有研究很少有对企业能源转型、政府监管 同地区企业能源消费产生的污染物对公共健康的影 与公众参与环境管理三方博弈的算例分析,而数值仿 响,利用剂量效应与暴露响应原理分析表明,以化石 真计算是科学技术探索研究的主要方法和手段之一, 能源消费为主的能源结构排放的污染物严重影响着 对于抽象且为动态及局部细节的研究问题,数值仿真 公众的公共健康水平,其排放的S02与PM10在2020 具有直观、可行性高的优点。 年导致的公共健康损失将达到4520~6150亿元, 为此,本文将排污企业、地方政府和公众3个主 几乎占同期GDP的1.06%。之后,学者们结合能源 体一同纳入到模型中,考虑公众健康损失赔偿大小, 消费、环境污染、经济增长和公公建康因素运用 综合研究三者间的相互机理:运用演化博弈论动态 LEAP模型和计量方法研究企业能源消费对环境、 分析排污企业是否实行能源转型、政府是否监管以 经济以及公共健康的影响,如Zhangts)、曲卫华 及公众是否参与环境管理行为的相互影响:最后用 等[6.2)从政府监管角度出发,Dong、Li]等运用 数值算例仿真了不同政策参数取值情况下各博弈方 静态博弈理论研究了中国电镀企业清洁生产的政策 的演化行为,为企业能源转型与公共健康水平提升 实施效果,认为政府的税收减免、生产设备补贴、清 政策的制定提供有力支撑。 洁能源创新成本补贴以及企业排污监管力度等措施 1政府、企业和公众三方博弈模型 对高污染企业向清洁化生产方向转型有重要影响。 近期学者通过最优化模型、信号博弈论的方法研究 1.1演化博弈模型假设 企业能源转型、技术创新、政府税收政策对环保的影 1.1.1博弈主体 响,如许士春等8,郭丕斌等[,Zheng等o,i 化石能源消费排放造成环境污染的直接利益相 等川,张国兴等[]。3)从公众参与角度出发,学 关者有:地方政府(简称“政府”)、排污企业和公众, 者们运用委托代理模型对企业的实证研究认为公众 3个博弈方均是有限理性。从地方政府角度来看, 参与力度对企业向绿色方向发展有重要影响,如 政府很可能会监管企业排污行为,对排污超标准的 Gera等[]。朱庆华和窦一杰通过构建政府补贴的 企业实行罚款、限制其生产(以下简称“监管”),也 绿色供应链管理博弈模型,研究认为政府应努力培 可能因为顾忌监管成本及影响本地区的国内生产总 育消费者的环保意识,这一举措是使政府和消费者 值下降而选择不监管(以下简称“不监管”):从企业 共赢的长远之计4,在此基础上,学者们对公众参 角度来看,企业很可能因为利益的驱使和顾忌能源 与下的企业环境行为进行研究,结果得出公众参与 转型成本继续以传统化石能源消费生产致使污染物 环境管理对企业减少环境污染行为有重要作用,如 超标准排放(以下简称“不实行能源转型”),也可能 Kaldellis等1s-6,杜建国等,郑思齐等[)。 顾忌政府的惩罚和实行能源转型后政府的补贴而实 上述研究对促进企业向绿色方向转型发展、提高 行能源转型(以下简称“实行能源转型”):从公众角 公众公共健康水平政策具有借鉴意义。但是在研究 度来看,公众很可能由于对环保意识的淡薄不参与 内容、研究方法与参数选择方面存在不足,忽略了我 环境管理(以下简称“不参与环境管理”),也可能考 国能源消费背景下,企业排污、政府监管与公众参与 虑企业排污带来的环境污染会使身体健康受损失而 三方的相互制约机理。具体来说,1)在研究内容上, 参与环境管理(以下简称“参与环境管理”)。由于 现有的博弈研究中仅涉及政府对公众参与环境管理 3个参与博弈方都是学习能力有限的理性参与人, 行为方面的奖励,没有考虑企业排污对公众公共健康 在信息不完全的情况下,三方在进行决策时往往不 损失赔偿因素,然而,企业排污严重影响着公众公共 会一开始就找到最优策略,会在博弈过程中学习博 健康水平的高低:现有研究仅涉及的是政府与企业、 弈,根据以往收益较大的策略不断调整自己的策略
相当于 2011 年平均月度卫生总费用的 11.2% [2] 。 现有文献主要从健康经济损失、政府监管和公 众参与等几个角度研究企业、政府和公众三方的能 源消费、环境保护与公共健康问题。 1)从健康经济 损失角度来看,Xia 等[3]通过对我国 30 个省份环境 污染物导致的公众健康经济损失研究,使用投入产 出方法表明,2007 年,由环境污染造成的公众公共 健康损失大约为 3 460 亿元;Wang [4] 研究了我国不 同地区企业能源消费产生的污染物对公共健康的影 响,利用剂量效应与暴露响应原理分析表明,以化石 能源消费为主的能源结构排放的污染物严重影响着 公众的公共健康水平,其排放的 SO2与PM10在 2020 年导致的公共健康损失将达到 4 520 ~ 6 150 亿元, 几乎占同期 GDP 的 1.06%。 之后,学者们结合能源 消费、环境污染、 经济增长和公公健康因素运用 LEAP 模型和计量方法研究企业能源消费对环境、 经济 以 及 公 共 健 康 的 影 响, 如 Zhang [5] 、 曲 卫 华 等[6] 。 2) 从政府监管角度出发,Dong、Li [7] 等运用 静态博弈理论研究了中国电镀企业清洁生产的政策 实施效果,认为政府的税收减免、生产设备补贴、清 洁能源创新成本补贴以及企业排污监管力度等措施 对高污染企业向清洁化生产方向转型有重要影响。 近期学者通过最优化模型、信号博弈论的方法研究 企业能源转型、技术创新、政府税收政策对环保的影 响,如许士春等[8] ,郭丕斌等 [9] , Zheng 等[10] , Li 等[11] ,张国兴等 [12] 。 3)从公众参与角度出发, 学 者们运用委托代理模型对企业的实证研究认为公众 参与力度对企业向绿色方向发展有重要影响,如 Gera 等 [13] 。 朱庆华和窦一杰通过构建政府补贴的 绿色供应链管理博弈模型,研究认为政府应努力培 育消费者的环保意识,这一举措是使政府和消费者 共赢的长远之计[14〛 ,在此基础上,学者们对公众参 与下的企业环境行为进行研究,结果得出公众参与 环境管理对企业减少环境污染行为有重要作用,如 Kaldellis 等[15-16] ,杜建国等[17] ,郑思齐等 [18] 。 上述研究对促进企业向绿色方向转型发展、提高 公众公共健康水平政策具有借鉴意义。 但是在研究 内容、研究方法与参数选择方面存在不足,忽略了我 国能源消费背景下,企业排污、政府监管与公众参与 三方的相互制约机理。 具体来说,1)在研究内容上, 现有的博弈研究中仅涉及政府对公众参与环境管理 行为方面的奖励,没有考虑企业排污对公众公共健康 损失赔偿因素,然而,企业排污严重影响着公众公共 健康水平的高低;现有研究仅涉及的是政府与企业、 企业与公众的两方博弈研究,对于政府、企业与公众 三方博弈的相关研究比较少;2)在研究方法上,大多 数研究主要采用暴露响应与剂量效应原理的解析法 或仅研究企业排污与政府监控、企业排污与公众参与 的两方博弈,未综合考虑企业能源转型、政府监管与 公众参与环境三者的动态机理,而公众参与行为对政 府监管力度与企业排污程度有重要影响;3)在数值仿 真方面,现有研究很少有对企业能源转型、政府监管 与公众参与环境管理三方博弈的算例分析,而数值仿 真计算是科学技术探索研究的主要方法和手段之一, 对于抽象且为动态及局部细节的研究问题,数值仿真 具有直观、可行性高的优点。 为此,本文将排污企业、地方政府和公众 3 个主 体一同纳入到模型中,考虑公众健康损失赔偿大小, 综合研究三者间的相互机理;运用演化博弈论动态 分析排污企业是否实行能源转型、政府是否监管以 及公众是否参与环境管理行为的相互影响;最后用 数值算例仿真了不同政策参数取值情况下各博弈方 的演化行为,为企业能源转型与公共健康水平提升 政策的制定提供有力支撑。 1 政府、企业和公众三方博弈模型 1.1 演化博弈模型假设 1.1.1 博弈主体 化石能源消费排放造成环境污染的直接利益相 关者有:地方政府(简称“政府”)、排污企业和公众, 3 个博弈方均是有限理性。 从地方政府角度来看, 政府很可能会监管企业排污行为,对排污超标准的 企业实行罚款、限制其生产(以下简称“监管”),也 可能因为顾忌监管成本及影响本地区的国内生产总 值下降而选择不监管(以下简称“不监管”);从企业 角度来看,企业很可能因为利益的驱使和顾忌能源 转型成本继续以传统化石能源消费生产致使污染物 超标准排放(以下简称“不实行能源转型”),也可能 顾忌政府的惩罚和实行能源转型后政府的补贴而实 行能源转型(以下简称“实行能源转型”);从公众角 度来看,公众很可能由于对环保意识的淡薄不参与 环境管理(以下简称“不参与环境管理”),也可能考 虑企业排污带来的环境污染会使身体健康受损失而 参与环境管理(以下简称“参与环境管理”)。 由于 3 个参与博弈方都是学习能力有限的理性参与人, 在信息不完全的情况下,三方在进行决策时往往不 会一开始就找到最优策略,会在博弈过程中学习博 弈,根据以往收益较大的策略不断调整自己的策略。 ·238· 智 能 系 统 学 报 第 12 卷
第2期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 ·239· 1.1.2模型参数 的定义和假设,建立化石能源消费背景下企业-政 为了研究各个博弈策略组合下,地方政府、排污 府-公众的三方博弈模型,如图1所示。根据模型 企业与公众三者的成本、收益与损失情况,设定下列 假设和图1得出相应的收益矩阵,8种收益组合如 相关政策参数和输入参数,如表1所示。通过上述表2所示,收益结果分别对应企业、政府和公众。 表1主要参数及其含义 Table 1 Main parameters and its meanings 参数 含义 政 a 企业实行能源转型后,政府对其减免税收的比率 策B 政府给予实行能源转型企业成本的补贴比例 参E 不实行能源转型的企业对公众公共健康损失的赔偿(即公众要求的赔偿) 数F 企业不实行能源转型、政府对企业的罚金 A 政府对参与环境管理的公众的奖励 C 企业实行能源转型所增加的技术、原材料与人力等成本 C2 企业继续排污、不实行能源转型的机会成本(包括企业形象破坏、公众抵制企业产品等) C 公众参与环境管理的成本 输 Ca 政府监管排污企业的成本 企业实行能源转型前,政府对其的税率 参 r 实行能源转型前,企业的净收益 数 To 实行能源转型企业增加的收益 8 不实行能源转型的企业被政府发现的概率 T 企业实行能源转型、环境质量改善后,公众所获得的公共健康水平收益 R 企业不实行能源转型导致的环境污染对居民的公共健康损失 R2 当政府对排污企业不监管,被公众发现后,政府形象、声誉的损失 政府不监管企业的行为被公众发现后,政府由于工作失职,应对环境污染导致的公共健康损失 E2 向公众支付额外的赔偿 62 政府不监管排污企业的行为被公众发现的概率 T2 公众参与环境管理过程中,对实行能源转型的企业产生了好感,企业因此得到的收益 政府监管环境排污行为有效,导致环境污染减少,公众参与环境管理对政府产生了好感,政府因名声提高 T: 等而得到的收益 表2企业-政府-公众收益矩阵 Table 2 Pay off matrix of enterprises,governments and the public 博弈策略 收益结果 1(1-r)[πe-(1-B)C:+T]+T2, (实行,监管,参与) aT[Tr -(1-B)C:+To]-BC:-C.+3,-C3 +A (实行,监管,不参与) {(1-ar)[Tr-(1-B)C,+π],ar[πg-(1-B)C1+πo]-BC,-C4,m1} (实行,不监管,参与) {(1-r)(mg-C,+mo)+T2,r(me-C1+mo)-0,R2,m1-C3+A (实行,不监管,不参与) (1-T)(TF -C1+To),7(T-C:+To), (不实行,监管,参与) {(1-T)πe-0F-E,-C2,Tmg+8F-C4+T;,π1-C3+A-R,+E,} (不实行,监管,不参与) (1-T)TF -0F-C2 TTE +0F-Ca,-R1 (不实行,不监管,参与) {(1-r)πe-E1-C2,tme-6E2,T1-C3+A+E,-R,+62E2} (不实行,不监管,不参与) (1-T)TE-C2,ITE,-R
1.1.2 模型参数 为了研究各个博弈策略组合下,地方政府、排污 企业与公众三者的成本、收益与损失情况,设定下列 相关政策参数和输入参数,如表 1 所示。 通过上述 的定义和假设,建立化石能源消费背景下企业-政 府-公众的三方博弈模型,如图 1 所示。 根据模型 假设和图 1 得出相应的收益矩阵,8 种收益组合如 表 2 所示,收益结果分别对应企业、政府和公众。 表 1 主要参数及其含义 Table 1 Main parameters and its meanings 参数 含义 政 策 参 数 α 企业实行能源转型后,政府对其减免税收的比率 β 政府给予实行能源转型企业成本的补贴比例 E1 不实行能源转型的企业对公众公共健康损失的赔偿(即公众要求的赔偿) F 企业不实行能源转型、政府对企业的罚金 A 政府对参与环境管理的公众的奖励 C1 企业实行能源转型所增加的技术、原材料与人力等成本 C2 企业继续排污、不实行能源转型的机会成本(包括企业形象破坏、公众抵制企业产品等) C3 公众参与环境管理的成本 输 C4 政府监管排污企业的成本 入 τ 企业实行能源转型前,政府对其的税率 参 πF 实行能源转型前,企业的净收益 数 π0 实行能源转型企业增加的收益 θ1 不实行能源转型的企业被政府发现的概率 π1 企业实行能源转型、环境质量改善后,公众所获得的公共健康水平收益 R1 企业不实行能源转型导致的环境污染对居民的公共健康损失 R2 当政府对排污企业不监管,被公众发现后,政府形象、声誉的损失 E2 政府不监管企业的行为被公众发现后,政府由于工作失职,应对环境污染导致的公共健康损失 向公众支付额外的赔偿 θ2 政府不监管排污企业的行为被公众发现的概率 π2 公众参与环境管理过程中,对实行能源转型的企业产生了好感,企业因此得到的收益 π3 政府监管环境排污行为有效,导致环境污染减少,公众参与环境管理对政府产生了好感,政府因名声提高 等而得到的收益 表 2 企业-政府-公众收益矩阵 Table 2 Pay off matrix of enterprises, governments and the public 博弈策略 收益结果 (实行,监管,参与) { (1 - ατ)[πF - (1 - β)C1 + π0 ] + π2 , ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 + π3 , π1 - C3 + A } (实行,监管,不参与) { (1 - ατ)[πF - (1 - β)C1 + π0 ] , ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 , π1 } (实行,不监管,参与) { (1 - τ)(πF - C1 + π0 ) + π2 , τ(πF - C1 + π0 ) - θ2R2 , π1 - C3 + A } (实行,不监管,不参与) { (1 - τ)(πF - C1 + π0 ) , τ(πF - C1 + π0 ) , π1 } (不实行,监管,参与) { (1 - τ)πF - θ1F - E1 - C2 , τπF + θ1F - C4 + π3 , π1 - C3 + A - R1 + E1 } (不实行,监管,不参与) { (1 - τ)πF - θ1F - C2 , τπF + θ1F - C4 , - R1 } (不实行,不监管,参与) { (1 - τ)πF - E1 - C2 , tπF - θ2E2 , π1 - C3 + A + E1 - R1 + θ2E2 } (不实行,不监管,不参与) { (1 - τ)πF - C2 , tπF , - R1 } 第 2 期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 ·239·
.240 智能系统学报 第12卷 π3}+x(1-z){ar[πp-(1-B)C1+To]-BC1- (企业 C4}+(1-x)z(Tπp+01F-C4+T3)+(1-x) 实行能源转型不实行能源转型 (1-z)(rπe+8,F-C4) 政府 政府 U2N=x2T(Tg-C+To)-02R2]+x(1- 监管 木监管 监管 不监管 2)[T(T-C:+To)]+(1-x)2(tTE- 公众 公众 公众 公众 02E2)+(1-x)(1-z)(tmr) 不参与参与不参与 参与不参与参与不参与 02=yUy+(1-y)U2x=ylxzlaT[πr-(1- (2)(3) (4)(5) (6)(7) (8) B)C+To]-BC1-Ca+T3+x(1-z)aT[TP- 图1企业-政府-公众三方博弈模型 (1-β)C,+To]-BC1-C4}+(1-x)z(rTr+0F- Fig.I Tripartite game model among enterprises,gov- C4+π3)+(1-x)(1-z)(rπp+0,F-C4)}+(1- ernments and the public y)x2[T(TF-C+To)-03R2]+x(1-2)[T(TP- 1.2演化博弈模型建立 C1+To)]+(1-x)z(tmp-02E2)+ 假设企业群体选择“实行能源转型”的比例为x (1-x)(1-z)(tmF)} (0≤x≤1),选择“不实行能源转型”的比例为1一 3)公众的期望收益为 x:政府群体选择“监管”的比例为y(0≤y≤1), Uy=xy(T1-C3+A)+x(1-y)((T1-C3+A)+ 选择“不监管”的比例为1一y;公众群体选择“参与 (1-x)y(T1-C3+A-R,+E,)+(1-x)(1- 环境管理”的比例为:,选择“不参与环境管理”的比 y)(T1-C3+A+E1-R1+02E2) 例为1-z(0≤z≤1)。设企业“实行能源转型”与 Uw=xyT1+x(1-y)T1+(1-x)y(-R,)+ “不实行能源转型”的期望收益及总的平均收益分 (1-x)(1-y)(-R) 别为Uy、U1w和U1;政府“监管”与“不监管”的期 U3=2U3y -(1-z)Uw=zxy(T-C3+A) 望收益及总的平均收益分别为Uy、U2x和U2;公众 x(1-y)(T1-C3+A)+(1-x)y(T1-C3+A- 选择“参与环境管理”与“不参与环境管理的期望收 R1+E)+(1-x)(1-y)(π1-C3+A+E,- R,+92E2)}-(1-z){xyT1+x(1-y)m1+(1- 益及总的平均收益分别为Uy、Uw和U。 x)y(-R,)+(1-x)(1-y)(-R1)} 根据以上分析,可以构建各博弈方的收益期望,1.3基于复制动态方程的稳定策略 其中: 根据演化博弈理论原理可知,当某一种策略的 1)企业的期望收益为 支付或适应度比种群的平均适应度高时,这种策略 Uy=yz(1-aT)[T-(1-B)C+To]+T2+ 在种群中就会演化发展,具体表现是种群中使用某 y(1-z){(1-ar)[πe-(1-B)C1+To]}+ 种策略的个体在种群中所在比例增长率大于零,这 (1-y)z[(1-r)(Tr-C1+To)+T2]+ 一过程称为复制动态方程。实际上,复制动态方程 (1-y)(1-z)[(1-r)(Te-C1+To)] 是某种特定策略在某一种群中被采用的频率或频度 Uw=yz[(1-t)πF-0F-E1-C2]+y(1-z) 的动态微分方程1。 [(1-t)πe-0F-C2]+(1-y)z[(1-t)πe- 1)基于复制动态方程原理,可构造企业策略的 E,-C2]+(1-y)(1-z)[(1-t)πp-C2] 复制动态方程为 U=xUy +(1-x)Uw=xyz(1-aT)[TF- F(x)= =x(Uw-0)= (1-B)C1+To]+T2}+xy(1-z){(1-aT)[Tr- x(1-x)(C1-T0-C1-E,+TT0-zT2- (1-B)C1+πo]}+x(1-y)[(1- ByC+TyC-01yF TyTe -TyT0 aTyC T)(πe-C1+π)+m2]+x(1-y)(1-z)[(1- aTyTTg TaByC atyzTo)= r)(πp-C+To)]+(1-x)yz[(1-T)πe-8F- x(1-x)[z(C2-E1-T2-yC2 yaTTo)+ E1-C2]+(1-x)y(1-z)[(1-T)πp-0F- y(C2 +TC-BC-0F-TTE- C2]+(1-x)(1-y)z[(1-T)Tp-E,-C2]+ TTO QTC aTTE TaBC)+C-C2- (1-x)(1-y)(1-z)[(1-T)Tp-C2] T0-TC1+TT。] 2)政府的期望收益为 ①若 U2y=xzaT[TP-(1-B)C To]-BC1-Ca+ 2=[y(C2 +TC-BC1-0F-TTF-TTO-
图 1 企业-政府-公众三方博弈模型 Fig.1 Tripartite game model among enterprises, gov⁃ ernments and the public 1.2 演化博弈模型建立 假设企业群体选择“实行能源转型”的比例为 x ( 0 ≤ x ≤ 1),选择“不实行能源转型”的比例为 1 - x ;政府群体选择“监管”的比例为 y ( 0 ≤ y ≤ 1), 选择“不监管”的比例为 1 - y ;公众群体选择“参与 环境管理”的比例为 z ,选择“不参与环境管理”的比 例为 1 - z ( 0 ≤ z ≤ 1)。 设企业“实行能源转型”与 “不实行能源转型” 的期望收益及总的平均收益分 别为 U1Y 、 U1N 和 U - 1 ;政府“监管”与“不监管”的期 望收益及总的平均收益分别为 U2Y 、 U2N 和 U - 2 ;公众 选择“参与环境管理”与“不参与环境管理的期望收 益及总的平均收益分别为 U3Y 、 U3N 和 U - 3 。 根据以上分析,可以构建各博弈方的收益期望, 其中: 1)企业的期望收益为 U1Y = yz{(1 - ατ)[πF - (1 - β)C1 + π0 ] + π2 } + y(1 - z){(1 - ατ)[πF - (1 - β)C1 + π0 ]} + (1 - y)z[(1 - τ)(πF - C1 + π0 ) + π2 ] + (1 - y)(1 - z)[(1 - τ)(πF - C1 + π0 )] U1N = yz[(1 - t)πF - θ1F - E1 - C2 ] + y(1 - z) [(1 - t)πF - θ1F - C2 ] + (1 - y)z[(1 - t)πF - E1 - C2 ] + (1 - y)(1 - z)[(1 - t)πF - C2 ] U - 1 = xU1Y + (1 - x)U1N = xyz{(1 - ατ)[πF - (1 - β)C1 + π0 ] + π2 } + xy(1 - z){(1 - ατ)[πF - (1 - β)C1 + π0 ]} + x(1 - y)z[(1 - τ)(πF - C1 + π0 ) + π2 ] + x(1 - y)(1 - z)[(1 - τ)(πF - C1 + π0 )] + (1 - x)yz[(1 - τ)πF - θ1F - E1 - C2 ] + (1 - x)y(1 - z)[(1 - τ)πF - θ1F - C2 ] + (1 - x)(1 - y)z[(1 - τ)πF - E1 - C2 ] + (1 - x)(1 - y)(1 - z)[(1 - τ)πF - C2 ] 2)政府的期望收益为 U2Y = xz{ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 + π3 } + x(1 - z){ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 } + (1 - x)z(τπF + θ1F - C4 + π3 ) + (1 - x) (1 - z)(τπF + θ1F - C4 ) U2N = xz[τ(πF - C1 + π0 ) - θ2R2 ] + x(1 - z)[τ(πF - C1 + π0 )] + (1 - x)z(tπF - θ2E2 ) + (1 - x)(1 - z)(tπF ) U - 2 = yU2Y + (1 - y)U2N = y{xz{ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 + π3 } + x(1 - z){ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 } + (1 - x)z(τπF + θ1F - C4 + π3 ) + (1 - x)(1 - z)(τπF + θ1F - C4 )} + (1 - y){xz[τ(πF - C1 + π0 ) - θ2R2 ] + x(1 - z)[τ(πF - C1 + π0 )] + (1 - x)z(tπF - θ2E2 ) + (1 - x)(1 - z)(tπF )} 3)公众的期望收益为 U3Y = xy(π1 - C3 + A) + x(1 - y)((π1 - C3 + A) + (1 - x)y(π1 - C3 + A - R1 + E1 ) + (1 - x)(1 - y)(π1 - C3 + A + E1 - R1 + θ2E2 ) U3N = xyπ1 + x(1 - y)π1 + (1 - x)y( - R1 ) + (1 - x)(1 - y)( - R1 ) U - 3 = zU3Y - (1 - z)U3N = z{xy(π1 - C3 + A) + x(1 - y)(π1 - C3 + A) + (1 - x)y(π1 - C3 + A - R1 + E1 ) + (1 - x)(1 - y)(π1 - C3 + A + E1 - R1 + θ2E2 )} - (1 - z){xyπ1 + x(1 - y)π1 + (1 - x)y( - R1 ) + (1 - x)(1 - y)( - R1 )} 1.3 基于复制动态方程的稳定策略 根据演化博弈理论原理可知,当某一种策略的 支付或适应度比种群的平均适应度高时,这种策略 在种群中就会演化发展,具体表现是种群中使用某 种策略的个体在种群中所在比例增长率大于零,这 一过程称为复制动态方程。 实际上,复制动态方程 是某种特定策略在某一种群中被采用的频率或频度 的动态微分方程[19] 。 1)基于复制动态方程原理,可构造企业策略的 复制动态方程为 F(x) = dx dt = x(U1Y - U - 1 ) = x(1 - x)(C1 - π0 - τC1 - zE1 + τπ0 - zπ2 - βyC1 + τyC1 - θ1 yF - τyπF - τyπ0 - ατyC1 + ατyπF + ταβyC1 + αtyzπ0 ) = x(1 - x)[z(C2 - E1 - π2 - yC2 + yατπ0 ) + y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] ①若 z = [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ·240· 智 能 系 统 学 报 第 12 卷
第2期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 ·241. QTC aTTe +TaBC)+C-C2 To -TC b)当 TTO]/(E +T2+yC2-C2 yaTo) a0,10[y(C2 +TC -BC-0F-TTE-TTO aTC+ 0.6 QTTTE TaBC1)+C-C2-To -TC +TTO]/ 0.4 (E1 T2+yC2-C2-yaTTo) 0.2 时.5(11>0,dF(1。0,此时x=1为 0.2 dx dx 上0 全局唯一的演化稳定策略:当公众参与环境管理达 0 不到一定程度并呈下降趋势时,污染企业实行能源 05 0.5 转型的可能性逐步增大,实行能源转型策略是企业 01.0 的最优选择,显然此种状态也不符合现实情况,是一 (b)公众参与环境管理程度较高时,企业行为演化图 种无效状态。 71 当C2-E,-π2-yC2+yarm。>0,又分两种情祝: a)当 1.0 3>[y(C2 +TC1-BC1-0F-TTP-TTO-QTCI 0.8 QTTg TaBC)C-C2 TO -TC 0.6 TTo]/(E:+π2+yC2-C2-yarπo) 0.4 时,5210此时=1为 0.2 dx 上0 全局唯一的演化稳定策略:当公众参与环境管理达 Lo 到一定程度并呈增大趋势时,污染企业实行能源转 0.5 0.5 型的可能性逐步加大,最终实行能源转型策略是其 01.0 最优选择。 (c)公众参与环境管理程度较低时,企业行为演化图
ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时,则 F(x) ≡ 0,这意味着所有水平都是稳定状态。 ②若 z ≠ [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时,令 F(x) = 0,得 x = 0, x = 1 是 x 的两个稳定点。 对 F(x) 求导得: dF(x) dx = (1 - 2x)[z(C2 - E1 - π2 - yC2 + yατπ0 ) + y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] 当 C2 - E1 - π2 - yC2 + yατπ0 < 0,又分两种情况: a)当 z > [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时, dF(x) dx | x = 1 > 0, dF(x) dx | x = 0 < 0,此时 x = 0 为 全局唯一的演化稳定策略;当公众参与环境管理达 到一定程度并呈增大趋势时,污染企业实行能源转 型的可能性逐步减小,最终不实行能源转型策略是 其最优选择,显然此种状态不符合现实情况,是一种 无效状态。 b)当 z < [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时, dF(x) dx | x = 1 < 0, dF(x) dx | x = 0 > 0,此时 x = 1 为 全局唯一的演化稳定策略;当公众参与环境管理达 不到一定程度并呈下降趋势时,污染企业实行能源 转型的可能性逐步增大,实行能源转型策略是企业 的最优选择,显然此种状态也不符合现实情况,是一 种无效状态。 当 C2 - E1 - π2 - yC2 + yατπ0 > 0,又分两种情况: a)当 z > [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时, dF(x) dx | x = 1 < 0, dF(x) dx | x = 0 > 0,此时 x = 1 为 全局唯一的演化稳定策略;当公众参与环境管理达 到一定程度并呈增大趋势时,污染企业实行能源转 型的可能性逐步加大,最终实行能源转型策略是其 最优选择。 b)当 z < [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时, dF(x) dx | x = 1 > 0, dF(x) dx | x = 0 < 0,此时 x = 0 为 全局唯一的演化稳定策略;当公众参与环境管理达 到一定程度并呈下降趋势时,污染企业实行能源转 型的可能性逐步减小,最终不实行能源转型策略是 其最优选择。 企业群体 3 种情况下的动态趋势及稳 定性如图 2 所示。 (a) 公共健康损失赔偿较大时,企业行为演化图 (b) 公众参与环境管理程度较高时,企业行为演化图 (c) 公众参与环境管理程度较低时,企业行为演化图 第 2 期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 ·241·
.242. 智能系统学报 第12卷 x(BC-TC +0 F TTe +TTo aTC- QTTTE -aTTO -aBTC)+Ca-0 F] 1.0 显然,-T3-02E2+x02E2-x02R2[x(BC-TC+0F TTg TTo+ 0.4 QTC:-QTTE QTTO aBTC)+Ca-0 F]/T3 0.2 上0 ,E-0,E+0,R,时,F91,00,此时y=0是全局唯一的演化稳定策 dz 1.0 略:当公众参与环境管理的可能性足够大并呈增大趋 ()企业不实行能源转型成本较大且公众参与环境管理 势时,地方政府对企业排污监管的力度会越来越小, 行为较强时,企业行为演化图 此时不监管或监管不严是地方政府的最优选择。 b)0,51,1< 0.8 d 0.6 0,此时y=1是全局唯一的演化稳定策略:当公众参 0.4 与环境管理的可能性足够小并呈减小趋势时,地方 0.2 政府对企业排污监管的力度会越来越大,此时监管 0 或严格监管是地方政府的最优选择。政府群体3种 1.0 0 情况下的动态趋势及稳定性如图3。 0.5 Z 01.0 ()企业不实行能源转型成本较小且公众参与环境管理 0 行为较弱时,企业行为演化图 图2企业群体的复制动态相位图 Fig.2 Phase diagram of replicator dynamics for enter- 0.5 prises group 2)基于复制动态方程原理,可构造政府策略的 复制动态方程为 10 F()=y=y(Ur-i2)=y(1-y)[(-m-06, 0.5 05 1.00 x02E2 -x02R2)+x(BC1-TCI +0F+TTg +TTo QTC aTTE aTTo -aBTC)+Ca-0 F] (a)政府监管收益较高时,政府行为演化图 ①若z=[x(BC1-TC1+0,F+TTp+TTo+ 2 QTC QTTE -QTTo aBTC)+Ca-0 F]/T3 02E2-x02E2+x02R2时,则F(y)≡0,这意味着所有 1.0 水平都是稳定状态。 ②若 z≠[x(BC1-TC1+0,F+TTg+TT。+aTC1- 0.5 QTTF aTTo aBTC)+Ca-0 F]/T3 +02E2- x02E2+x02R2 时,令F(y)=0,得y=0,y=1是y的两个稳定点, 0 10 0 对F(y)求导得: 0.5 0.5 =(1-2y)[(-m3-0,E,+x0,E2-0,R,)+ 1.00 dy (b)公众参与环境管理程度较高时,政府行为演化图
(d) 企业不实行能源转型成本较大且公众参与环境管理 行为较强时,企业行为演化图 (e) 企业不实行能源转型成本较小且公众参与环境管理 行为较弱时,企业行为演化图 图 2 企业群体的复制动态相位图 Fig.2 Phase diagram of replicator dynamics for enter⁃ prises group 2)基于复制动态方程原理,可构造政府策略的 复制动态方程为 F(y) = dy dt = y(U2Y - U - 2 ) = y(1 - y)[z( - π3 - θ2E2 + xθ2E2 - xθ2R2 ) + x(βC1 - τC1 + θ1F + τπF + τπ0 + ατC1 - ατπF - ατπ0 - αβτC1 ) + C4 - θ1F] ①若 z = [x(βC1 - τC1 + θ1F + τπF + τπ0 + ατC1 - ατπF - ατπ0 + αβτC1 ) + C4 - θ1F] / π3 + θ2E2 - xθ2E2 + xθ2R2 时,则 F(y) ≡0,这意味着所有 水平都是稳定状态。 ②若 z ≠ [x(βC1 - τC1 + θ1F + τπF + τπ0 + ατC1 - ατπF - ατπ0 + αβτC1 ) + C4 - θ1F] / π3 + θ2E2 - xθ2E2 + xθ2R2 时,令 F(y) = 0,得 y = 0, y = 1 是 y 的两个稳定点, 对 F(y) 求导得: dy dy = (1 - 2y)[z( - π3 - θ2E2 + xθ2E2 - θ2R2 x) + x(βC1 - τC1 + θ1F + τπF + τπ0 + ατC1 - ατπF - ατπ0 - αβτC1 ) + C4 - θ1F] 显然, - π3 - θ2E2 + xθ2E2 - xθ2R2 < 0,此时又分两 种情况: a)当 z > [x(βC1 - τC1 + θ1F + τπF + τπ0 + ατC1 - ατπF - ατπ0 - αβτC1 ) + C4 - θ1F] / π3 + θ2E2 - xθ2E2 + xθ2R2 时, dF(z) dz | y = 0 < 0, dF(z) dz | y = 1 > 0,此时 y = 0 是全局唯一的演化稳定策 略;当公众参与环境管理的可能性足够大并呈增大趋 势时,地方政府对企业排污监管的力度会越来越小, 此时不监管或监管不严是地方政府的最优选择。 b)当 z < [x(βC1 - τC1 + θ1F + τπF + τπ0 + ατC1 - ατπF - ατπ0 - αβτC1) + C4 - θ1F] / π3 + θ2E2 - xθ2E2 + xθ2R2 时, dF(z) dz | y = 0 > 0, dF(z) dz | y = 1 < 0 ,此时 y = 1 是全局唯一的演化稳定策略;当公众参 与环境管理的可能性足够小并呈减小趋势时,地方 政府对企业排污监管的力度会越来越大,此时监管 或严格监管是地方政府的最优选择。 政府群体 3 种 情况下的动态趋势及稳定性如图 3。 (a) 政府监管收益较高时,政府行为演化图 (b) 公众参与环境管理程度较高时,政府行为演化图 ·242· 智 能 系 统 学 报 第 12 卷
第2期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 ·243· 时,最终参与环境管理是公众的最优选择。公众群 体3种情况下的动态趋势及稳定性如图4。 1.0 Z◆ 0.5 0.5 Y O 1.0 05 05 1.0o 0 (©)公众参与环境管理程度较小时,政府行为演化图 0 05 0.5 图3政府群体的动态相位图 Fig.3 Phase diagram of replicator dynamics for gov- 010 ernments group ()政府不监管被公众发现的概率较高时,公众行为演化图 3)基于复制动态方程原理,可构造公众策略的 复制 F(e)==(Uy-i)=(1-[(xE,6 1.0 E,02)+x(2R1-E,+T1-E202)+A-C3+ E1-2R1+T1+E202] 0.5 ①y=x(2R1-E,+T1-E,02)+A-C3+E,- 2R1+π1+E02]/(E292-xE202)时,则F(z)=0,这意 味着所有水平都是稳定状态。 0 0 ②若y≠x(2R1-E1+T1-E292)+A-C+E, 0.5 05 -2R1+π1+E202]/(E202-xE202)时,令F(z)=0 100 ,得z=0,z=1是z的两个稳定点,对 F(z)求导得: (b)政府监管行为较高时,公众行为演化图 dFa=1-2z[y(xE,,-E,)+(2R1-E+ Z dz T,-E202)+A-C3+E,-2R1+T1+E,02] 显然,xE,02-E202x(2R1-E1+T1-E202)+A-C+ E,-2R+m1+E,6]/(E0,-x,)时,dF 0.5 dz 1。0.此时:=0为全局唯-的 0\t 演化稳定策略;当政府监管的力度达到一定程度并 05 呈增大趋势时,公众参与环境管理的可能性逐步减 0s 小,最终不参与环境管理是其最优选择。 o1.0 b)y0,de 1.4模型稳定性分析 演化稳定策略;当政府监管的力度足够小并呈减小 由图2可知,平面S,把三维区域分为S2与S,两 趋势时,公众参与环境管理的可能性逐步加大,此 部分:由图3可知,平面S,把三维区域分为S,与S6
(c) 公众参与环境管理程度较小时,政府行为演化图 图 3 政府群体的动态相位图 Fig.3 Phase diagram of replicator dynamics for gov⁃ ernments group 3)基于复制动态方程原理,可构造公众策略的 复制 F(z) = dz dt = z(U3Y - U - 3 ) = z(1 - z)[y(xE2 θ2 - E2 θ2 ) + x(2R1 - E1 + π1 - E2 θ2 ) + A - C3 + E1 - 2R1 + π1 + E2 θ2 ] ① y = x(2R1 - E1 + π1 - E2 θ2) + A - C3 + E1 - 2R1 + π1 + E2 θ2] / (E2 θ2 - xE2 θ2) 时,则 F(z) ≡0,这意 味着所有水平都是稳定状态。 ②若 y ≠ x(2R1 - E1 + π1 - E2 θ2 ) + A - C3 + E1 - 2R1 + π1 + E2 θ2 ] / (E2 θ2 - xE2 θ2 ) 时,令 F(z) = 0 ,得 z = 0, z = 1 是 z 的两个稳定点,对 F(z) 求导得: dF(z) dz = (1 - 2z)[y(xE2 θ2 - E2 θ2 ) + x(2R1 - E1 + π1 - E2 θ2 ) + A - C3 + E1 - 2R1 + π1 + E2 θ2 ] 显然, xE2 θ2 - E2 θ2 < 0,此时又分两种情况: a) y > x(2R1 - E1 + π1 - E2 θ2 ) + A - C3 + E1 - 2R1 + π1 + E2 θ2 ] / (E2 θ2 - xE2 θ2 ) 时, dF(z) dz | z = 0 < 0, dF(z) dz | z = 1 > 0,此时 z = 0 为全局唯一的 演化稳定策略;当政府监管的力度达到一定程度并 呈增大趋势时,公众参与环境管理的可能性逐步减 小,最终不参与环境管理是其最优选择。 b) y < x(2R1 - E1 + π1 - E2 θ2 ) + A - C3 + E1 - 2R1 + π1 + E2 θ2 ] / (E2 θ2 - xE2 θ2 ) 时, dF(z) dz | z = 0 > 0, dF(z) dz | z = 1 < 0,此时 z = 1 为全局唯一的 演化稳定策略;当政府监管的力度足够小并呈减小 趋势时,公众参与环境管理的可能性逐步加大,此 时,最终参与环境管理是公众的最优选择。 公众群 体 3 种情况下的动态趋势及稳定性如图 4。 (a) 政府不监管被公众发现的概率较高时,公众行为演化图 (b)政府监管行为较高时,公众行为演化图 (c) 政府监管行为较小时,公众行为演化图 图 4 公众群体的动态相位图 Fig.4 Phase diagram of replicator dynamics for the pu⁃ bic group 1.4 模型稳定性分析 由图 2 可知,平面 S1把三维区域分为 S2与 S3两 部分;由图 3 可知,平面 S4把三维区域分为 S5与 S6 第 2 期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 ·243·
.244. 智能系统学报 第12卷 两部分:由图4可知,平面S,把三维区域分为S。与 府、公众策略的演化路径分别一致,企业策略的演化 S,两部分。综合该非对称三方参与主体的演化博弈 路径相反。由此,也可得出,在整个三维空间策略 可以得到不同的均衡状态,讨论分析如下: 内,该三方博弈不会收敛于某一稳定策略。 由前面分析可知,在C2-E,-T2-yC2+yarπ。0、-T3- 的三方博弈群体中所有参与者的必然选择。根据三 02E2+x02E2-0,R2<0与xE202-E,02<0的条件下: 方复制动态方程可知,公众公共健康损失赔偿E,较 1)当初始状态落在S2、S,与S区域的交集空间 小、企业能源转型的声誉收益π3较少、政府对企业 时,该博弈收敛于平衡点(1,0,0),即(实行能源转 的罚金F较少时,三方群体的演化博弈路径为{x→ 型、不监管、不参与环境管理)是企业、政府与公众的 0,y0,z0}。 三方博弈群体中所有参与者的必然选择。通过1.3 6)当初始状态落在S3、S,与S,区域的交集空间 小节企业策略的复制动态方程可知,当企业对公众 时,该博弈收敛于平衡点(0,0,1),即(不实行能源 公共健康损失赔偿增大、企业不实行能源转型的机 转型、不监管、参与环境管理)是企业、政府与公民的 会成本增大、公众对企业能源转型好感增强时, 三方博弈群体中所有参与者的必然选择。根据三方 d(1.1<0,企业实行能源转型的策略x→1:当 复制动态方程分析可知,公众公共健康水平获得收 dx 益π,增加、公众参与环境管理成本C,较小、政府对 公众参与环境管理的概率极大时,政府监管策略会 企业的罚金F较大时,三方群体的演化傅弈路径为 减小;当政府监管污染企业的概率增加、公众参与环x→0,y→0,z→1}。 境管理所得收益较小时,公众不参与环境管理。 7)当初始状态落在S3S。与Sg区域的交集空间时, 2)当初始状态落在S2、S,与S,区域的交集空间 该博弈收敛于平衡点(0,1,0),即(不实行能源转型、监 时,该博弈收敛于平衡点(1,0,1),即(实行能源转 管、不参与环境管理)是企业、政府与公民的三方博弈 型、不监管、参与环境管理)是企业、政府与公民的三 群体中所有参与者的必然选择。根据三方复制动态方 方博弈群体中所有参与者的必然选择。根据复制动 程分析可知,政府监管企业的成本C,减小、政府对企业 态方程可知,当政府监管环境管理成本稍增加、监管 的罚金F较大时、补贴成本B增大时,三方群体的演化 策略概率减下时,公众参与环境管理的策略概率 博弈路径为x0,y→1,z0{。 z→1,而政府监管企业的策略概率y0。通过对比 8)当初始状态落在S,、S。与S,区域的交集空间 状态①和②可知,只要影响企业、政府、公众三方博 时,该博弈收敛于平衡点(0,1,1),即(不实行能源 弈因素参数稍作变化,三方博弈策略的收敛路径就 转型、监管、参与环境管理)是企业、政府与公民的三 会变化。 方博弈群体中所有参与者的必然选择。根据三方复 3)当初始状态落在S2、S。与S区域的交集空间 制动态方程分析可知,政府对企业的罚金F较小、公 时,该博弈收敛于平衡点(1,1,0),即(实行能源转 众公共健康损失赔偿E,较小、能源转系成本C,较 型、监管、不参与环境管理)是企业、政府与公民的三 小、补贴成本B减小、税收减免比率α增大时,三方 方博弈群体中所有参与者的必然选择。基于1.3复 群体的演化博弈路径为{x→0,y→1,z→1}。 制动态方程中的参数可知,当政府对公众奖励A较 通过对模型分析可知,尽管该三方博弈在某 小、政府不监管被公众发现的概率日,以及政府向公 局部范围内会收敛于各自的稳定策略(平衡点),但 众支付的额外损失赔偿E,较小时,公众参与环境管 该三方博弈过程不会固定地演化为某一个固定策略 理的概率:→0:当政府对排污企业不监管被公众发 的集合,这是因为,在能源消费背景下,影响企业能 现的声誉损失R,与公共健康损失赔偿E,之差减小 源消费转型、政府监管与公众参与环境管理的因素 时,即政府不监管排污企业的声誉损失全部用于公 有多种,结合1.3小节复制动态方程、对上述八种策 共健康损失赔偿时,政府监管企业的概率y→1。 略的局部稳定性分析可知,当某一个随机因素发生 4)当初始状态落在S2、S。与S,区域的交集空间 改变,将促使其中一方也会改变选择策略,且这三方 时,该博弈收敛于平衡点(1,1,1),即(实行能源转 的行为决策又是相互影响,相互作用的,这将促使三 型、监管、参与环境管理)是企业、政府与公民的三方 方的策略选择不断调整。从而使该模型没有演化稳 博弈群体中所有参与者的必然选择。由1.3复制动 定策略。然而在环境污染日益恶化的今天,公众参 态方程可知,当政府对公众奖励A较大、政府不监管 与的环境行为必不可少,本文的第4)种情形与现实 被公众发现的概率,以及政府向公众支付的额外 情况比较吻合,是理想的博弈结果。由于本文涉及 损失赔偿E,较大时,公众参与环境管理的概率z→ 参数较多,在没有具体值的情况下,参数间相互影响 0。下列5)~8)4种状态跟上述1)~4)4种状态政 的分析比较不容易,针对这种情况,本文通过算例来
两部分;由图 4 可知,平面 S7把三维区域分为 S8与 S9两部分。 综合该非对称三方参与主体的演化博弈 可以得到不同的均衡状态,讨论分析如下: 由前面分析可知,在 C2 - E1 - π2 - yC2 + yατπ0 < 0 、 - π3 - θ2E2 + xθ2E2 - θ2R2 < 0 与 xE2 θ2 - E2 θ2 < 0 的条件下,系统状态与现实不符,是一种无效状态。 在 C2 - E1 - π2 - yC2 + yατπ0 > 0、 - π3 - θ2E2 +xθ2E2 - θ2R2 < 0 与 xE2 θ2 - E2 θ2 < 0 的条件下: 1)当初始状态落在 S2 、S5与 S8区域的交集空间 时,该博弈收敛于平衡点(1,0,0),即(实行能源转 型、不监管、不参与环境管理)是企业、政府与公众的 三方博弈群体中所有参与者的必然选择。 通过 1.3 小节企业策略的复制动态方程可知,当企业对公众 公共健康损失赔偿增大、企业不实行能源转型的机 会成本增大、 公众对企业能源转型好感增强时, dF(x) dx | x = 1 < 0,企业实行能源转型的策略 x →1;当 公众参与环境管理的概率极大时,政府监管策略会 减小;当政府监管污染企业的概率增加、公众参与环 境管理所得收益较小时,公众不参与环境管理。 2)当初始状态落在 S2 、S5与 S9区域的交集空间 时,该博弈收敛于平衡点(1,0,1),即(实行能源转 型、不监管、参与环境管理)是企业、政府与公民的三 方博弈群体中所有参与者的必然选择。 根据复制动 态方程可知,当政府监管环境管理成本稍增加、监管 策略概率减下时,公众参与环境管理的策略概率 z →1, 而政府监管企业的策略概率 y →0。 通过对比 状态①和②可知,只要影响企业、政府、公众三方博 弈因素参数稍作变化,三方博弈策略的收敛路径就 会变化。 3)当初始状态落在 S2 、S6与 S8区域的交集空间 时,该博弈收敛于平衡点(1,1,0),即(实行能源转 型、监管、不参与环境管理)是企业、政府与公民的三 方博弈群体中所有参与者的必然选择。 基于 1.3 复 制动态方程中的参数可知,当政府对公众奖励 A 较 小、政府不监管被公众发现的概率 θ2 以及政府向公 众支付的额外损失赔偿 E2 较小时,公众参与环境管 理的概率 z →0;当政府对排污企业不监管被公众发 现的声誉损失 R2 与公共健康损失赔偿 E2 之差减小 时,即政府不监管排污企业的声誉损失全部用于公 共健康损失赔偿时,政府监管企业的概率 y →1。 4)当初始状态落在 S2 、S6与 S9区域的交集空间 时,该博弈收敛于平衡点(1,1,1),即(实行能源转 型、监管、参与环境管理)是企业、政府与公民的三方 博弈群体中所有参与者的必然选择。 由 1.3 复制动 态方程可知,当政府对公众奖励 A 较大、政府不监管 被公众发现的概率 θ2 以及政府向公众支付的额外 损失赔偿 E2 较大时,公众参与环境管理的概率 z → 0。 下列 5) ~8)4 种状态跟上述 1) ~ 4) 4 种状态政 府、公众策略的演化路径分别一致,企业策略的演化 路径相反。 由此,也可得出,在整个三维空间策略 内,该三方博弈不会收敛于某一稳定策略。 5)当初始状态落在 S3 、S5与 S8区域的交集空间 时,该博弈收敛于平衡点(0,0,0),即(不实行能源 转型、不监管、不参与环境管理)是企业、政府与公民 的三方博弈群体中所有参与者的必然选择。 根据三 方复制动态方程可知,公众公共健康损失赔偿 E1 较 小、企业能源转型的声誉收益 π3 较少、政府对企业 的罚金 F 较少时,三方群体的演化博弈路径为{ x → 0, y →0, z →0}。 6)当初始状态落在 S3 、S5与 S9区域的交集空间 时,该博弈收敛于平衡点(0,0,1),即(不实行能源 转型、不监管、参与环境管理)是企业、政府与公民的 三方博弈群体中所有参与者的必然选择。 根据三方 复制动态方程分析可知,公众公共健康水平获得收 益 π1 增加、公众参与环境管理成本 C3 较小、政府对 企业的罚金 F 较大时,三方群体的演化博弈路径为{ x →0, y →0, z →1}。 7)当初始状态落在 S3、S6与 S8区域的交集空间时, 该博弈收敛于平衡点(0,1,0),即(不实行能源转型、监 管、不参与环境管理)是企业、政府与公民的三方博弈 群体中所有参与者的必然选择。 根据三方复制动态方 程分析可知,政府监管企业的成本 C4 减小、政府对企业 的罚金 F 较大时、补贴成本 β 增大时,三方群体的演化 博弈路径为{ x →0, y →1, z →0}。 8)当初始状态落在 S3 、S6与 S9区域的交集空间 时,该博弈收敛于平衡点(0,1,1),即(不实行能源 转型、监管、参与环境管理)是企业、政府与公民的三 方博弈群体中所有参与者的必然选择。 根据三方复 制动态方程分析可知,政府对企业的罚金 F 较小、公 众公共健康损失赔偿 E1 较小、能源转系成本 C1 较 小、补贴成本 β 减小、税收减免比率 α 增大时,三方 群体的演化博弈路径为{ x →0, y →1, z →1}。 通过对模型分析可知,尽管该三方博弈在某一 局部范围内会收敛于各自的稳定策略(平衡点),但 该三方博弈过程不会固定地演化为某一个固定策略 的集合,这是因为,在能源消费背景下,影响企业能 源消费转型、政府监管与公众参与环境管理的因素 有多种,结合 1.3 小节复制动态方程、对上述八种策 略的局部稳定性分析可知,当某一个随机因素发生 改变,将促使其中一方也会改变选择策略,且这三方 的行为决策又是相互影响,相互作用的,这将促使三 方的策略选择不断调整。 从而使该模型没有演化稳 定策略。 然而在环境污染日益恶化的今天,公众参 与的环境行为必不可少,本文的第 4)种情形与现实 情况比较吻合,是理想的博弈结果。 由于本文涉及 参数较多,在没有具体值的情况下,参数间相互影响 的分析比较不容易,针对这种情况,本文通过算例来 ·244· 智 能 系 统 学 报 第 12 卷
第2期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 .245 研究第4)种情形。 2.1 选择某种策略初始情况变化对演化结果影响 数值实验 数值实验结果如图5,其中x、y和z分别表示污染 2 企业选择实行能源转型的初始比例、政府选择监管的 由于所列式子的复杂性,针对企业实行能源转 比例以及公众选择参与环境管理的比例。基于山西省 型后,政府对其减免税收的比率α、政府给予实行能 某发电企业和专家咨询,满足上文系统博弈收敛于平 源转型企业成本的补贴B,以及公众公共健康损失 衡点(1,1,1)的第4)种情形下参数值如下(单位:万 赔偿E,、政府对不实行能源转型企业的罚金F等政 元):a=0.2,B=0.3,A=150,F=100,C1=520,C2= 策参数采用Matlab软件(版本:R2012b)对第4)中 420,C3=5,C,=8,E,=6,T=0.3,πe=1000,T。=40 情形做数值模拟,以期得到有益的结论为政府监管 T2=8,T3=3,T1=2,R1=1.5,E2=1,01=0.8,02=0.75, 相关部门及公共卫生部门的决策提供参考。 R2=2。从图5中得知排污企业群体、政府监管机构与 公众群体之间策略交往行为演化的路径依赖性。 1.0 1.0 ◇0aa网o866560000 1.0 oooooooooooc 0g学4*** 0.8 ▣=0.8 ★x0.6 ◆x=0.4 ,幸安马 。。职 x=0.2 0.2doo000oo0o0oo0000 06★ ▣=0.8 会以华称草学学区学草量单华华华草单的的的的论务 ▣1-0.8 0.4 04 ★x=0.6 0.2d00000000000000000nm000000000m0 0.4 ★x=0.6 ◆1x-0.4 =0.4 0x0.2 0x-0.2 0 0.0050.0100.0150.0200.0250.030 00.0050.0100.0150.0200.0250.030 0 0.0050.0100.0150.0200.0250.030 (a)y=0.2,0.8 (b)x=0.6z=0.8 (c)x-0.23-0.8 ◇0oooo98888688060 1.0 1.0 48 1.0 0.9 0.8 口1-0.8 0.8D 0.7 1=0.6 104 4444华溜 01=0.8 0.6 01=0.2 ooooooooooooooooooooooocpoo00 0.6 t=0.6 0.5 ★=0.6 ◆J=0.4 0.4 0.4 ◆x0.4000 0.4 0J-0.2 0.3 0-0.2 0.2 050.0100.0150.0200.0250.300.26eo00o0000000000 0.005 00.0050.0100.0150.0200.0250.030 0.0050.0100.0150.0200.0250.030 (a7y0.2,z0.3 (b)x0.3,z0.8 (c)x-0.9J=0.8 1.0 1.0 Lba4a66663 1.0 2000080oooooooooooxoooo ▣2=0.8 ▣-0.8 020.8 ★ -0.6 ★x=0.6 0.6 ★2=0.6 ◆20.4 ◆x-0.4 ◆2=0.4 0 2=0.2 SSSSO000 0 01x-0.2 。。8 0.4 0z=0.2 0 0.0050.01000150.0200.0250.030 00.0050.0100.0150.0200.0250.030 00.0050.0100.0150.0200.0250.030 (a")=0.6,2-=0.8 (b"-0.6.-0.2 (c")-0.2,=0.2 图5选择某一策略的不同初始情况对演化结果的影响 Fig.5 The effect of various initial conditions choosing a policy on evolution results 从图5中的(a)、(b)和(c)看出,x的收敛方向与 在x固定的条件下,z值越大,y收敛于平衡状态的速 速度和y、z有关,在y固定的条件下,z越大,x收敛速 度也越快。从图5中的(a)、(b)和(c)看出,在y固定 度越快,可以很快收敛于理想的稳定状态:但在:值较 的条件下,x取值越大,z收敛于平衡状态的速度要稍 高且固定的条件下,如z=0.8,从(a)、(c)可知,y越大, 慢:在x固定的条件下,y取值越大,z收敛于平衡状态 x收敛于稳定状态的速度越慢。从图5中的(a)、(b) 的速度也稍慢。从图5中的9个子图可看出:污染企 和(c)看出,y的收敛方向和速度与x、z有关,在z固 业、政府与公众群体各自行为的演化结果和收敛时间 定的条件下,x越大,y很快收敛于理想的稳定状态。 不仅受本群体中选择“能源转型”、“实行监管”与“参与
研究第 4)种情形。 2 数值实验 由于所列式子的复杂性,针对企业实行能源转 型后,政府对其减免税收的比率 α 、政府给予实行能 源转型企业成本的补贴 β ,以及公众公共健康损失 赔偿 E1 、政府对不实行能源转型企业的罚金 F 等政 策参数采用 Matlab 软件(版本:R2012b) 对第 4) 中 情形做数值模拟,以期得到有益的结论为政府监管 相关部门及公共卫生部门的决策提供参考。 2.1 选择某种策略初始情况变化对演化结果影响 数值实验结果如图5,其中 x 、 y 和 z 分别表示污染 企业选择实行能源转型的初始比例、政府选择监管的 比例以及公众选择参与环境管理的比例。 基于山西省 某发电企业和专家咨询,满足上文系统博弈收敛于平 衡点(1,1,1)的第 4)种情形下参数值如下(单位:万 元): α =0.2, β = 0.3, A = 150, F = 100, C1 = 520, C2 = 420, C3 =5, C4 =8, E1 = 6, τ = 0.3, πF = 1000, π0 = 40, π2 = 8, π3 =3, π1 =2, R1 =1.5, E2 =1, θ1 =0.8, θ2 =0.75, R2 =2。 从图 5 中得知排污企业群体、政府监管机构与 公众群体之间策略交往行为演化的路径依赖性。 图 5 选择某一策略的不同初始情况对演化结果的影响 Fig.5 The effect of various initial conditions choosing a policy on evolution results 从图 5 中的(a)、(b)和(c)看出, x 的收敛方向与 速度和 y 、 z 有关,在 y 固定的条件下, z 越大, x 收敛速 度越快,可以很快收敛于理想的稳定状态;但在 z 值较 高且固定的条件下,如 z =0.8,从(a)、(c)可知, y 越大, x 收敛于稳定状态的速度越慢。 从图 5 中的(a)、(b) 和(c)看出, y 的收敛方向和速度与 x 、 z 有关,在 z 固 定的条件下, x 越大, y 很快收敛于理想的稳定状态。 在 x 固定的条件下, z 值越大, y 收敛于平衡状态的速 度也越快。 从图 5 中的(a)、(b)和(c)看出,在 y 固定 的条件下, x 取值越大, z 收敛于平衡状态的速度要稍 慢;在 x 固定的条件下, y 取值越大, z 收敛于平衡状态 的速度也稍慢。 从图 5 中的 9 个子图可看出:污染企 业、政府与公众群体各自行为的演化结果和收敛时间 不仅受本群体中选择“能源转型”、“实行监管”与“参与 第 2 期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 ·245·
·246 智能系统学报 第12卷 环境管理”各自初始比例的影响,其中一方还受另外两 2.3成本补贴对演化结果的影响 方选择平衡状态策略的初始概率影响。相比污染企 政府对企业实行能源转型成本的补贴对三方博 业,政府博弈方来说,公众参与环境管理行为的策略较 弈演化结果的影响如图7(a)、(b)与(c)。分别对 少受本群体初始比例与另两方初始比例的影响」 比图5(a)、(b)与(c)和图7(a)、(b)与(c)可知,政 2.2税收率改变对演化结果的影响 府对企业成本补贴的加大不会改变企业收敛于平衡 在企业实行能源转型后,政府监管机构通常在原 状态的方向,但从实验数值观察,增加成本补贴后 有税率的基础上继续减少税率。分析了税率改变对演 企业群体演化与实行能源转型策略速度变慢:而政 化结果的影响。数值实验结果如图6,除参数α外,其 府群体演化于监管策略的速度会加快。 他参数取值如图5。对比图5(a)和图6(a)可以看出, 。一8 1.0 增大参数α(税收减免减小),企业选择实行能源转型 的演化博弈方向不会改变,但从演化博弈实验仿真数 值看,增大参数α,企业会加快收敛速度。对比图5 (b)和图6(b)可以看出,增大参数α,会影响政府收敛 于平衡状态的方向,甚至会使演化博弈结果偏离平衡 状态。对比图5(c)和图6(c)可以看出,增大参数a, QOOOOOOOOOOOOOOOOOO Q =0.8 =0.6 ◆ =0.4 0 1-02 不会改变公众参与环境管理的演化博弈方向和速度。 0.2 0.0050.0100.0150.0200.0250.030 一一一一一一 1.0r (a)y=0.2,z=0.8 ,a=0.8 ▣x-0.8 ★x0.6 1.0r ◆x-0.4 1=0.8 0x0.2 2e4586800og 1=0.6 ◆ =0.4 0.6★ 0 1=0.2 0.0050.0100.0150.0200.0250.030 0.4 (a)y=0.2,z=0.8,a=0.8 1.0 0.2e 0.8cW9 0 0.0050.0100.0150.0200.0250.030 (b)x=0.6,z=0.8,a=0.8 0.6 03-0.8000 “莎 1.0 020a0oo0000∞o0 ooo041=0.6 ◆=0.4 ▣-0.8 0-0.2 ★2=0.6 0 0.0050.0100.0150.0200.0250.030 2000000ooooooooo00000000 ◆20.4 02-0.2 (b)x=0.6,z=0.8,a=0.8 0 “NOODODSCGG金 1.0m * 0.0050.0100.0150.0200.0250.030 ▣2=0.8 (c)x=0.2,y=0.8,a=0.8 ★2=0.6 图7实行能源转型企业成本的补贴对演化结果的影响 ◆2-0.4 Fig.7 The effect of enterprise cost subsidies for energy 02-0.2 transformation given govenment on evolution re- sutls 2.4公共健康损失赔偿对演化结果的影响 0 0.0050.0100.0150.0200.0250.030 公众要求不实行能源转型的企业健康损失赔偿 (c)x=0.2,y=0.8,a=0.8 图6政府给予能源转型的企业税率改变对演化结果的影响 对演化结果的影响如图8(a)、(b)与(c),除参数E Fig.6 The effect of enterprise tax changes for energy 外,其他参数取值同图5。分别对比图5与图8中 transformation given governments on evolution 的(a)、(b)与(c)可以看出,增加不实行能源转型的 results
环境管理”各自初始比例的影响,其中一方还受另外两 方选择平衡状态策略的初始概率影响。 相比污染企 业、政府博弈方来说,公众参与环境管理行为的策略较 少受本群体初始比例与另两方初始比例的影响。 2.2 税收率改变对演化结果的影响 在企业实行能源转型后,政府监管机构通常在原 有税率的基础上继续减少税率。 分析了税率改变对演 化结果的影响。 数值实验结果如图 6,除参数 α 外,其 他参数取值如图 5。 对比图 5(a)和图 6(a)可以看出, 增大参数 α (税收减免减小),企业选择实行能源转型 的演化博弈方向不会改变,但从演化博弈实验仿真数 值看,增大参数 α ,企业会加快收敛速度。 对比图 5 (b)和图 6(b)可以看出,增大参数 α ,会影响政府收敛 于平衡状态的方向,甚至会使演化博弈结果偏离平衡 状态。 对比图 5(c)和图 6(c)可以看出,增大参数 α , 不会改变公众参与环境管理的演化博弈方向和速度。 (a) y = 0.2,z = 0.8,α = 0.8 (b) x = 0.6,z = 0.8,α = 0.8 (c) x = 0.2,y = 0.8,α = 0.8 图 6 政府给予能源转型的企业税率改变对演化结果的影响 Fig.6 The effect of enterprise tax changes for energy transformation given governments on evolution results 2.3 成本补贴对演化结果的影响 政府对企业实行能源转型成本的补贴对三方博 弈演化结果的影响如图 7( a)、( b)与( c)。 分别对 比图 5(a)、(b)与(c)和图 7(a)、(b)与(c)可知,政 府对企业成本补贴的加大不会改变企业收敛于平衡 状态的方向,但从实验数值观察,增加成本补贴后, 企业群体演化与实行能源转型策略速度变慢;而政 府群体演化于监管策略的速度会加快。 (a) y = 0.2,z = 0.8,α = 0.8 (b) x = 0.6,z = 0.8,α = 0.8 (c) x = 0.2,y = 0.8,α = 0.8 图 7 实行能源转型企业成本的补贴对演化结果的影响 Fig.7 The effect of enterprise cost subsidies for energy transformation given govenment on evolution re⁃ sutls 2.4 公共健康损失赔偿对演化结果的影响 公众要求不实行能源转型的企业健康损失赔偿 对演化结果的影响如图 8(a)、(b)与(c),除参数 E1 外,其他参数取值同图 5。 分别对比图 5 与图 8 中 的(a)、(b)与(c)可以看出,增加不实行能源转型的 ·246· 智 能 系 统 学 报 第 12 卷