244 智能系统学报 第4卷 调中的应用研究[J].应用科技,2008,35(1):5760. 策略研究[J].控制与决策,2007,22(12):1335-1340. YAN Zheping,LI Feng,HUANG Yufeng.Research on ap- YANG Hongbing,YAN Hongsen.Adaptive strategy of dy- plication of multi-agent Q-learling in multiAUV coordina- namic scheduling in knowledgeable manufacturing system tion[J].Applied Science and Technology,2008,35(1): [J].Control and Decision,2007,22(12):1335-1340. 5760. [9]WATKINS C,DAYAN P.Technical note:Q-leaming[J]. [2]潘燕春,冯允成,周泓,等.强化学习和仿真相结合的 Machine Leaming,1992,8(3/4):279-292. 车间作业排序系统[J].控制与决策,2007,22(6): 作者简介: 675-679 王国磊,男,1982年生,博士研究 PAN Yanchun,FENG Yuncheng,ZHOU Hong,et al.Re- 生,主要研究方向为生产计划和车间调 inforcement learning integrated with simulation for job-shop 度等,发表学术论文10余篇. scheduling system [J].Control and Decision,2007,22 (6):675679 [3]AYDIN M E,OZTEMEL E.Dynamic job-shop scheduling u- sing reinforcement learning agents[J].Robotics and Auton- 钟诗胜,男,1964年生,教授,博士 omous Systems,2000,33(2/3):169-178. 生导师.哈尔滨工业大学威海分校副校 [4]WANG Y C,USHER J M.Application of reinforcement 长、中国机械工程学会机械设计分会理 learning for agent-based production scheduling[J].Engi- 事、中国人工智能学会可拓学专业委员 neering Applications of Artificial Intelligence,2005,18 会常务理事、中国工程图学学会应用图 (1):73-82. 学专业委员会委员、全画工业自动化系 [5]WANG Y C,USHER J M.Learning policies for single ma- 统与集成标准化技术委员会委员、国防科工委信息技术应用 chine job dispatching[J].Robotics and Computer Integrat- 标准化技术委员会委员.主要研究方向为数字化设计与制 ed Manufacturing,2004,20(6):553-562. 造、人工智能理论与应用、数控设备研发等.国家863/CMS [6]魏英姿,赵明扬.强化学习算法中启发式回报函数的设 重大应用示范工程项目一“HEC-CMSⅡ工程”的副总设 计及其收敛性分析[J].计算机科学,2005,32(3):190- 计师,主持国家自然科学基金项目2项、国家863计划项目2 193. 项,参与国家863计划项目1项、国家自然科学基金项目1 WEI Yingzi,ZHAO Mingyang.Design and convergence a- 项,承担欧盟科技计划项目(英国、中国、西班牙联合承担)1 nalysis of a heuristic reward function for reinforcement leam- 项,多项省(部)级科技项目和企业横向项目.曾获省部级科 ing algorithms[J].Computer Science,2005,32(3):190- 技进步二等奖1项、三等奖2项,专利1个和国家自主版权 193. 登记软件3套,被评为黑龙江省CIMS应用示范先进个人.发 [7]王世进,孙展,周炳海,等.基于Q学习的动态单机调 表学术论文140余篇,出版专著1部. 度[J].上海交通大学学报,2007,41(8):1227-1232. 林琳,女,1973年生,副教授,硕士 WANG Shijin,SUN Sheng,ZHOU Binghai,et al.Q-leamn- 生导师.主要研究方向为智能设计和产品 ing based dynamic single machine scheduling[J].Journal 数据管理等发表学术论文20余篇。 of Shanghai Jiaotong University,2007,41(8):1227-1232. [8]杨宏兵,严洪森.知识化制造系统中动态调度的自适应