请详细描述python # Custom environment wrapperclass StreetFighterCustomWrappergymWrapper def __init__self env reset_round=0 rendering=False superStreetFighterCustomWrapper self__init__env s
这是一个自定义的OpenAI Gym环境包装器,用于街头霸王游戏。它采用了一个deque来存储最近9帧的图像,以便于构建连续的动作序列。在每个步骤中,它将当前观察值添加到帧堆栈中,并使用每个动作的观察值执行多个步骤。它计算自定义奖励,其中包括惩罚和奖励,例如将对手的剩余生命值作为惩罚,将代理的剩余生命值作为奖励。它还包括一个标志,用于确定是否在屏幕上显示游戏。最后,它将观察值、奖励、完成标志和信息返回给调用者。
原文地址: http://www.cveoy.top/t/topic/fmlH 著作权归作者所有。请勿转载和采集!