摘要:
为了缓解城市快速路拥堵和尾气排放问题, 提出了基于竞争结构和深度循环 Q 网络
的改进非支配排序遗传算法 (non-dominated sorting genetic algorithm II based on dueling
deep recurrent Q network, DRQN-NSGA-II). 该算法结合了基于竞争结构的深度 Q 网络(dueling deep Q network, Dueling DQN)、深度循环 Q 网络 (deep recurrent Q network,
DRQN) 和 NSGA-II 算法, 将 Dueling DRQN-NSGA-II 算法用于匝道控制问题. 除了考虑
匝道车辆汇入以提高快速路通行效率外, 还考虑了环境和能源指标, 将尾气排放和燃油消耗
作为评价指标. 除了与无控制情况及其他算法进行比较之外, Dueling DRQN-NSGA-II 还与NSGA-II 算法进行了比较. 实验结果表明: 与无控制情况相比, 本算法能有效改善路网通
行效率、缓解环境污染、减少能源损耗; 相对于无控制情况, 总花费时间 (total time spent,
TTS) 减少了 16.14%, 总尾气排放 (total emissions, TE) 减少了 9.56%, 总燃油消耗 (total
fuel consumption, TF) 得到了 43.49% 的改善.
中图分类号:
陈 娟, 郭 琦. 基于强化学习的改进 NSGA-II 算法的城市快速路入口匝道控制 [J]. 上海大学学报(自然科学版), 2023, 29(4): 666-680.
CHEN Juan, GUO Qi. Urban expressway on-ramp control based on
improved NSGA-II algorithm of
reinforcement learning [J]. Journal of Shanghai University(Natural Science Edition), 2023, 29(4): 666-680.