gmh5225/RLT - Gitstar Ranking

gmh5225

Fetched on 2026/07/13 21:13

Training teachers with reinforcement learning able to make LLMs learn how to reason for test time scaling. - View it on GitHub

Star

Rank

14123341