[视频作者] 梦游社
[视频时长] 3:46
[视频类型] 野生技能协会
代码:(づ ̄3 ̄)づ超过100点赞公布代码 BGM:Bionic Games;The Flight Of The Bumble-Bee; 在非随机环境中,强化学习模型往往像一个录像机,仅仅将可以通关的路径记录下来。而在随机环境中,AI需要真正理解环境,这会大幅提高学习难度。风叶穿行是一个有趣的随机跳跃游戏,为了攻克这个游戏,我们利用了最稳定的改进版的PPO算法,并围绕模型做了大量特征工程。 新人up主第一次剪辑,拜托各位用三连给我们一个小小的鼓励,谢谢大家o(〃'▽'〃)o。
![[图]【风叶穿行】聪明的人类哟,你能超过我的AI么?](https://i0.hdslb.com/bfs/archive/1dbffed380b82036b51db3449a31a855185690b4.jpg)