AWS DeepRacer 奖励函数：根据中心、左右位置和速度评分

以下是一个可能的 AWS DeepRacer 奖励函数，根据您的要求进行了调整：

def reward_function(params):
    # 读取输入变量
    center = params['distance_from_center']
    left = params['is_left_of_center']
    right = params['is_left_of_center']
    speed = params['speed']
    
    # 设置中心、左、右的目标值
    target_center = 0.0
    target_left = 0.4
    target_right = -0.4
    
    # 计算与目标值的距离
    diff_center = abs(center - target_center)
    diff_left = abs(left - target_left)
    diff_right = abs(right - target_right)
    
    # 根据与目标值的接近程度计算奖励
    if diff_center < 0.1:
        reward = 1.0
    elif diff_left < 0.1:
        reward = 0.5
    elif diff_right < 0.1:
        reward = 0.5
    else:
        reward = 1e-3
    
    # 惩罚速度慢
    if speed < 1:
        reward *= 0.5
    
    return reward

该函数首先读取输入变量 'distance_from_center'、'is_left_of_center'、'is_left_of_center' 和 'speed'。然后，它将 'center'、'left' 和 'right' 与目标值进行比较，并计算出它们与目标值之间的距离。如果车在最近的点符合要求，则函数返回 1.0。如果车在左边或右边的最近点符合要求，则函数返回 0.5。如果车不在任何最近点上，则函数返回接近零的奖励。最后，如果车速度低于 1，函数会将奖励乘以 0.5，以惩罚速度慢的车。