学术报告
题 目:Policy Iteration Reinforcement Learning Method for Continuous-time Mean-Field Linear-Quadratic Optimal Problem
报 告 人:李娜 教授 (邀请人:杨舟 )
山东财经大学统计与数学学院
时 间:1月5日 16:30-17:30
地 点:数科院西楼二楼会议室
报告人简介:
李娜,二级教授,博士生导师,青年长江学者,首届山东省科学技术青年奖获得者,山东财经大学统计与数学学院副院长;兼任山东省科协第十届委员会委员、中国自动化学会TCCT随机系统控制委员会委员、山东省大数据研究会理事、《Math Review》评论员等。近年来,在控制论领域国际三大顶级期刊《SIAM Journal on Control and Optimization》、《Automatica》、《IEEE Transactions on Automatic Control》等国际著名学术期刊发表高水平论文20余篇;先后主持国家自然科学基金项目3项、山东省自然科学基金项目2项、山东省高等学校科技项目2项;曾获山东省高等学校科学技术奖二等奖1项、山东省省级教学成果二等奖3项;主持教育部供需对接就业育人项目1项、产学合作协同育人项目2项、山东省研究生教育优质课程建设项目1项。
摘 要:
This work employs a policy iteration reinforcement learning (RL) method to investigate continuous-time mean-field linear quadratic problems over an infinite horizon. The drift and diffusion terms in the dynamics involve the state as well as the control. The stability and convergence of the RL algorithm are examined using a Lyapunov Recursion. Instead of solving a pair of coupled Riccati equations, the RL technique focuses on strengthening an auxiliary function and the cost functional as the objective functions and updating the new policy to compute the optimal control via state trajectories. A numerical example sheds light on the established theoretical results.
欢迎老师、同学们参加、交流!