这是一个使用PyTorch实现的基于PPO算法的超级马里奥游戏AI项目,旨在训练一个能够自动玩超级马里奥游戏的智能体。 类似的项目有: - OpenAI Gym:一个用于开发和比较强化学习算法的工具包,其中包含了许多经典的强化学习环境,如CartPole、MountainCar等。 - DeepMind Atari:DeepMind团队使用深度强化学习算法在Atari游戏上取得了很好的成果,包括使用DQN算法在Breakout、Pong等游戏上超越人类水平。 - AlphaGo:DeepMind团队使用深度强化学习算法开发的围棋AI,成功击败了世界冠军李世石。