divelab/OpenRLHF - Gitstar Ranking

divelab

Fetched on 2026/03/01 22:46

An Easy-to-use, Scalable and High-performance RLHF Framework based on Ray (PPO & GRPO & REINFORCE++ & vLLM & Ray & Dynamic Sampling & Async Agentic RL) - View it on GitHub

https://openrlhf.readthedocs.io/

Star

Rank

14121396

divelab

divelab / OpenRLHF