win4r/RLHF-make-review-positive - Gitstar Ranking

win4r

Fetched on 2026/06/23 05:50

RLHF-based text generation optimization using PPO and reward modeling with Hugging Face TRL. - View it on GitHub

Star

0

Rank

14037453