26 / 2025-04-30 17:29:19
基于深度学习的开放多场景智能训练算法设计与开发
深度学习;强化学习;体系博弈场景;智能决策
摘要待审
姜嘉成 / 北京电子工程总体研究所
贾政轩 / 北京电子工程总体研究所
赵芃芃 / 北京电子工程总体研究所
林廷宇 / 北京电子工程总体研究所
徐钊 / 北京电子工程总体研究所
欧一鸣 / 北京电子工程总体研究所
在博弈过程中,针对传统的目标分配会存在灵活性不足、决策迭代周期长的问题,同时智能决策小模型也较难同时在多种体系博弈场景中取得较好的对抗效果的问题,本文提出一种基于深度学习的开放多场景智能训练算法,利用强化学习训练得到单个体系博弈场景的最优智能决策模型,并生成大量决策数据,通过深度学习训练在开放体系博弈场景中的智能决策模型,实现最优博弈泛化效能。

 
重要日期
  • 会议日期

    08月02日

    2025

    08月04日

    2025

  • 06月01日 2025

    初稿截稿日期

主办单位
国防科技大学系统工程学院
联系方式
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询