Glavin001/trlx - Gitstar Ranking

Glavin001

Fetched on 2026/01/31 14:08

A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF) - View it on GitHub

Star

Rank

13272006