勷勤数学•专家报告-张俊玉

勷勤数学•专家报告


题      目:基于前景理论的折扣随机博弈与应用


报  告  人: 张俊玉 副教授  (邀请人:刘秋丽)

                                     中山大学


时      间: 1月8日  10:30-11:30

          

地     点:数科院西楼111报告厅


报告人简介:

       中山大学数学学院副教授,主要研究方向包括Markov决策过程,灵敏度分析,随机优化,随机博弈等。先后主持过国家自然科学基金青年项目、面上项目和广东省基础与应用基础研究基金(面上项目)等,参与国家自然科学基金重点项目和国家重点研发计划“数学和应用研究”专项项目等。在控制领域著名期刊IEEE Transactions on Automatic Control和Automatica都发表过数篇长文。


摘      要:

        本研究探讨了基于前景理论的非零和分布式随机博弈模型,考虑的准则是折扣准则。该模型为非平稳模型,每位参与者独立控制各自的马尔可夫链,其主观行为通过前景理论进行描述。与2018年首次提出的前景理论下平均准则研究相比,本研究关注效用的时间价值。由于前景理论对概率进行扭曲,导致在证明均衡存在性时起关键作用的最优方程不复存在。此外,当固定其他参与者的平稳策略时,博弈转化为非平稳马尔可夫决策过程,此时占据测度不再适用。为此,我们通过构建任意时刻状态-行动对的边际分布探索了一种新技术,并证明了纳什均衡的存在性。进一步地,这种技术可扩展至有限阶段准则。随后,我们提出了一种求解马尔可夫ε-均衡的算法,并证明了算法的收敛性。最后,将模型应用于智能电网中产消者之间的非合作随机博弈,并给出仿真结果来验证算法的有效性。


       


          欢迎老师、同学们参加、交流!