mfkiwl/FlexGen - Gitstar Ranking

mfkiwl

Fetched on 2026/06/23 02:18

Running large language models like OPT-175B/GPT-3 on a single GPU. Up to 100x faster than other offloading systems. - View it on GitHub

Star

Rank

14053879