本网讯(通讯员 贾露/文 王海涛/图)9月初,国际科技创新中心网站公布了2022年度北京市科学技术奖评审结果,我校软件学院专任教师王海涛所参与的《深度强化学习算法和最优性分析》项目荣获2022年度北京市科学技术自然科学奖二等奖,该奖项表彰项目团队在深度强化学习和最优分析项目中的研究成果,是对团队成员成果的认可。
该项目聚焦深度强化学习理论和方法的前沿研究,提出了新型高效的深度强化学习算法。该算法不仅显著减少了计算量,还在状态有效表征、注意力机制设计、参数共享和迁移机制等方面取得了突破。这些创新性的技术设计不仅提高了算法性能,还增强了算法在不同场景中的迁移泛化能力,减少了对数据和计算平台的依赖。项目还面向多个体的通讯受限问题,提出了事件驱动的在线强化学习和最优分析方法,并借鉴了最优控制和博弈论等领域的理论,成功证明了闭环系统的稳定性和神经网络最优解的收敛性。
这一成果在多体系统的协同控制和决策中具有较为重要的理论和应用价值,该项目的成果不仅为深度强化学习领域的发展提供了新思路,也对促进理论研究向实际应用转化有积极的推动作用。
责任编辑:李开泉