【大模型】3小时完全从0训练一个仅有26M的小参数GPT,最低仅需2G显卡即可推理训练! - View it on GitHub
Star
2
Rank
4169475