《超级马里奥兄弟》的近端策略优化(Proximal Policy Optimization,PPO)算法。

bluesky1年前 ⋅ 44 阅读

有哪些类似的项目?

这是一个使用PyTorch实现的基于PPO算法的超级马里奥游戏AI项目,旨在训练一个能够自动玩超级马里奥游戏的智能体。

类似的项目有:
- OpenAI Gym:一个用于开发和比较强化学习算法的工具包,其中包含了许多经典的强化学习环境,如CartPole、MountainCar等。
- DeepMind Atari:DeepMind团队使用深度强化学习算法在Atari游戏上取得了很好的成果,包括使用DQN算法在Breakout、Pong等游戏上超越人类水平。
- AlphaGo:DeepMind团队使用深度强化学习算法开发的围棋AI,成功击败了世界冠军李世石。

全部评论: 0

    相关推荐