《超级马里奥兄弟》的近端策略优化（Proximal Policy Optimization，PPO）算法。

bluesky ⋅ 1年前 ⋅ 44 阅读

github.com/uvipen/Super-mario-bros-PPO-p...

马里奥近端 Proximal Policy Optimization

有哪些类似的项目？

这是一个使用PyTorch实现的基于PPO算法的超级马里奥游戏AI项目，旨在训练一个能够自动玩超级马里奥游戏的智能体。

类似的项目有：
- OpenAI Gym：一个用于开发和比较强化学习算法的工具包，其中包含了许多经典的强化学习环境，如CartPole、MountainCar等。
- DeepMind Atari：DeepMind团队使用深度强化学习算法在Atari游戏上取得了很好的成果，包括使用DQN算法在Breakout、Pong等游戏上超越人类水平。
- AlphaGo：DeepMind团队使用深度强化学习算法开发的围棋AI，成功击败了世界冠军李世石。

全部评论: 0 条

相关推荐