根据表4结果,可以得知DDQN模型的成功率最高,因此在集成深度强化学习模型对三个模型的输出结果进行投票时,如果票数相同,则选择DDQN模型输出的驾驶行为。集成深度强化学习模型在测试阶段的驾驶行为决策数据如表4所示,其中车辆在3个回合中发生了碰撞,但决策成功率达到了97%。相较于DQN、DDQN和Dueling DDQN模型,成功率分别提高了6%、3%和6%。同时,集成深度强化学习模型的平均车速也高于这三种单一网络模型。虽然集成深度强化学习模型的平均耗时略高于三种单一网络模型,但仍小于1ms,可以满足车辆驾驶行为决策的实时性要求。


原文地址: https://www.cveoy.top/t/topic/bq1k 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录