IBM/helm-enterprise-benchmark

IBM

Fetched on 2025/12/10 10:16

In this project, we develop an enterprise benchmark framework for large language model (LLM) evaluation. We extend HELM, an open-source benchmark framework developed by Stanford CRFM, to enable users evaluate LLMs with domain-specific datasets such as finance, legal, climate, and cybersecurity. - View it on GitHub

Star

Rank

3990542

IBM

IBM / helm-enterprise-benchmark