lipiji/RL4LMs - Gitstar Ranking

lipiji

Fetched on 2026/06/23 01:04

A modular RL library to fine-tune language models to human preferences - View it on GitHub

Star

Rank

14036447