勷勤数学•专家报告
题 目:基于前景理论的折扣随机博弈与应用
报 告 人: 张俊玉 副教授 (邀请人:刘秋丽)
中山大学
时 间: 1月8日 10:30-11:30
地 点:数科院西楼111报告厅
报告人简介:
中山大学数学学院副教授,主要研究方向包括Markov决策过程,灵敏度分析,随机优化,随机博弈等。先后主持过国家自然科学基金青年项目、面上项目和广东省基础与应用基础研究基金(面上项目)等,参与国家自然科学基金重点项目和国家重点研发计划“数学和应用研究”专项项目等。在控制领域著名期刊IEEE Transactions on Automatic Control和Automatica都发表过数篇长文。
摘 要:
本研究探讨了基于前景理论的非零和分布式随机博弈模型,考虑的准则是折扣准则。该模型为非平稳模型,每位参与者独立控制各自的马尔可夫链,其主观行为通过前景理论进行描述。与2018年首次提出的前景理论下平均准则研究相比,本研究关注效用的时间价值。由于前景理论对概率进行扭曲,导致在证明均衡存在性时起关键作用的最优方程不复存在。此外,当固定其他参与者的平稳策略时,博弈转化为非平稳马尔可夫决策过程,此时占据测度不再适用。为此,我们通过构建任意时刻状态-行动对的边际分布探索了一种新技术,并证明了纳什均衡的存在性。进一步地,这种技术可扩展至有限阶段准则。随后,我们提出了一种求解马尔可夫ε-均衡的算法,并证明了算法的收敛性。最后,将模型应用于智能电网中产消者之间的非合作随机博弈,并给出仿真结果来验证算法的有效性。
欢迎老师、同学们参加、交流!