ddworken/hh-rlhf - Gitstar Ranking

ddworken

Fetched on 2026/05/08 10:21

Human preference data for "Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback" - View it on GitHub

Star

Rank

13971272