Python 代码计算奖励:数值与阈值比较
如果数值越低于'TOTAL_NUM_STEPS_1st',奖励越好,可以使用以下 Python 代码来计算奖励:
num = 330
reward = 0
TOTAL_NUM_STEPS_1st = 15 * 22
TOTAL_NUM_STEPS_2nd = 15 * 23
TOTAL_NUM_STEPS_3rd = 15 * 24
if num < TOTAL_NUM_STEPS_1st:
reward = 100
elif num < TOTAL_NUM_STEPS_2nd:
reward = 50
elif num < TOTAL_NUM_STEPS_3rd:
reward = 25
else:
reward = 0
print(reward)
在这个代码中,我们首先将 num 的值设置为 330,然后根据不同的阈值进行判断,如果 num 小于 'TOTAL_NUM_STEPS_1st',则奖励为 100;如果 num 小于 'TOTAL_NUM_STEPS_2nd',则奖励为 50;如果 num 小于 'TOTAL_NUM_STEPS_3rd',则奖励为 25;否则,奖励为 0。最后打印出奖励的值。
原文地址: https://www.cveoy.top/t/topic/p5NJ 著作权归作者所有。请勿转载和采集!