ikostrikov/pytorch-a2c-ppo-acktr-gail

ikostrikov

Fetched on 2026/07/13 15:59

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) and Generative Adversarial Imitation Learning (GAIL). - View it on GitHub

Star

3902

Rank

10625

ikostrikov

ikostrikov / pytorch-a2c-ppo-acktr-gail