hzwer/trlx - Gitstar Ranking

hzwer

Fetched on 2026/07/13 19:26

A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF) - View it on GitHub

Star

Rank

14111567