ranahanocka/pytorch-a2c-ppo-acktr

ranahanocka

Fetched on 2026/01/31 17:48

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO) and Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR). - View it on GitHub

Star

Rank

13531022

ranahanocka

ranahanocka / pytorch-a2c-ppo-acktr