[视频作者] QQ飞车手游-零号
[视频时长] 1:57
[视频类型] 手机游戏
基于强化学习和监督学习训练算法,主要通过最大化快速跑圈的奖励和碰撞的惩罚等方式来学会如何刷记录,并且在贴弯和过弯耗时上设置评分函数来让Ai尽可能的去增加过弯速度和贴弯,在技巧理解上直接简单除暴的调用宏的一键过弯,省去了让Ai理解游戏技巧的过程。 Ai重点关注的是入弯和出弯时机,但是因为游戏是有帧率波动的所以并不能总是完美过弯,以及受限于个人设备性能对ai计算速度点影响。所以还增加了过弯预判即-即将碰撞弯道时的刹车调整策略。 Ai大约刷出了10把47小了才出的46,训练过程经常需要人工干预去纠正各种参数,属