lucidrains/llama-qrlhf - Gitstar Ranking

Gitstar Ranking

Users
Organizations
Repositories
Rankings

Sign in with GitHub

lucidrains

Fetched on 2026/06/26 11:03

lucidrains / llama-qrlhf

Implementation of the Llama architecture with RLHF + Q-learning - View it on GitHub

Star

170

Rank

203036

Released by @k0kubun in December 2014. Fork me on GitHub.