NVIDIA/TransformerEngine - Gitstar Ranking

NVIDIA

Fetched on 2026/02/22 08:29

A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit and 4-bit floating point (FP8 and FP4) precision on Hopper, Ada and Blackwell GPUs, to provide better performance with lower memory utilization in both training and inference. - View it on GitHub

https://docs.nvidia.com/deeplearning/transformer-engine/user-guide/index.html

Star

3169

Rank

12536

NVIDIA

NVIDIA / TransformerEngine