gmh5225/grpo-llm-evaluator - Gitstar Ranking

gmh5225

Fetched on 2026/05/08 11:55

Fine-tunes a student LLM using teacher feedback for improved reasoning and answer quality. Implements GRPO with teacher-provided evaluations. - View it on GitHub

Star

Rank

13993518

gmh5225

gmh5225 / grpo-llm-evaluator