设为首页|加为收藏|English

学术报告
来源:  时间:2016-12-08   《打印》
自适应动态规划最新进展

时间地点:Dec19,10:00-11:00,N602

 

报告人:刘德荣

北京科技大学自动化学院

derong@ustb.edu.cn

 

摘要:

非线性系统的最优控制动态规划方法需要求解非线性Bellman方程,离散时间的问题由于需要求解非线性差分方程,其求解非常困难。长期以来,动态规划方法虽然理论上可以求解非线性系统的最优控制问题,但是由于时间反向计算而产生的维数灾问题,实际问题中无法完成其超大的计算量。自适应动态规划方法跟强化学习方法同属源于动态规划方法的自学习控制算法,所提的算法可以用来解决未知离散时间非线性系统的最优控制问题,在近期给出的该控制算法的收敛性证明基础上,提出了一系列新算法。算法的实现用到了三个神经网络,在递推的每一步分别用来近似性能指标函数、最优控制律和未知非线性系统。仿真结果证明了自学习控制算法的有效性。

 

简简介:

刘德荣,北京科技大学自动化学院教授、博士生导师。1982年从华东工学院毕业并获机械工程学士学位,1987年从中国科学院自动化研究所毕业并获自动控制理论及应用硕士学位,1994年从美国圣母大学毕业并获电气工程博士学位。曾在美国通用汽车公司研究开发中心工作和斯蒂文斯理工学院电机与计算机工程系任助教授。从1999年开始,在芝加哥伊利诺依大学电机与计算机工程系工作,先后任该校助教授 (1999–2002)、终身职副教授 (2002–2006)和终身职正教授 (2006年起)2008年,入选中国科学院百人计划在自动化研究所任研究员。2009年,入选中组部千人计划。曾任中国科学院自动化研究所复杂系统管理与控制国家重点实验室副主任。自1992年以来,共发表了130多篇SCI论文、200多篇国际会议论文。同他人合作共出版过17本书。曾受邀在20多个国际会议上做大会报告。主要从事智能控制理论及应用、计算智能、过程控制、电力系统运行与控制、复杂系统理论与方法等方面的研究工作。1999年获美国国家科学基金会教授早期事业发展奖。2006年获伊利诺依大学的大学学者奖。2008年获中国国家自然科学基金委海外杰出青年合作研究基金2011年获中组部国家特聘专家称号。2014年获亚太神经网络联合会杰出成就奖。曾任IEEE神经网络与学习系统汇刊》总主编。现任IFAC理事、IEEE计算智能学会理事、亚太神经网络学会副主席、中国自动化学会常务理事、Springer的《人工智能评论》主编。2005年当选IEEE Fellow2013年当选INNS Fellow2016年当选IAPR Fellow
附件
相关文档