摘要详情

ID / 提交时间

1 / 2026-03-28 23:58:54

标题

低碳燃料与AI协同驱动的甲醇增程式混合动力系统能量管理研究

关键字

甲醇增程式混合动力；港口拖轮；多智能体深度强化学习；多目标优化；硬件在环验证

主题及专题

（3）低碳能源及AI赋能

状态

全文待审

作者

钊李 / 大连理工大学能源与动力学院

武强隆 / 大连理工大学能源与动力学院

华田 / 大连理工大学能源与动力学院

摘要

针对甲醇增程式串联混合动力港口拖轮在复杂作业工况下面临的燃油经济性、多污染物排放（NO_x、CO₂、CO、HC）与电池寿命衰减的多目标冲突问题，本文提出一种基于多智能体深度强化学习（MADRL）的协同优化能量管理策略。区别于传统单智能体方法将多目标简单加权求和，本策略构建了“发动机智能体”与“电池智能体”的协作博弈框架：发动机智能体以最小化甲醇消耗与多污染物综合排放为目标，电池智能体以最小化电池老化应力（基于放电倍率与SOC变化率构建）为目标，两者通过共享状态信息与联合奖励函数，在策略优化过程中自动学习目标间的动态权衡，实现多目标的协同优化。首先，基于船舶动力学、发动机准静态排放模型（含甲醇消耗及四种污染物）、二阶RC电池模型及老化半经验模型，构建高保真系统仿真平台。其次，设计分层式多智能体强化学习架构，采用多智能体近端策略优化（MAPPO）算法进行集中式训练与分布式执行，并引入注意力机制增强智能体间的关键信息交互。随后，针对多目标优化中难以获取统一最优解的问题，提出基于帕累托边界的动态权重调节机制，使策略能够根据系统状态（如SOC、功率需求）自适应调整优化侧重点。最后，基于双NI PXIe实时仿真机构建硬件在环（HIL）测试平台，验证策略的实时性与鲁棒性。仿真结果表明，所提策略在典型港口作业循环中，相较于基于规则策略，甲醇消耗降低13.2%，NO_x、CO₂、CO、HC排放分别降低7.7%、12.5%、12.9%、16.3%，电池老化应力降低24.5%；与单智能体TD3算法相比，多目标协同性显著提升，各性能指标在帕累托前沿上分布更优。HIL测试证实，在3.5 ms平均通信延迟下，策略性能衰减小于2%，单步决策时间仅0.65 ms，满足实时控制要求。本研究为复杂混合动力系统多目标优化提供了一种新的多智能体协同决策范式。