OpenGVLab/Multi-Modality-Arena

OpenGVLab

Fetched on 2026/07/13 21:48

Chatbot Arena meets multi-modality! Multi-Modality Arena allows you to benchmark vision-language models side-by-side while providing images as inputs. Supports MiniGPT-4, LLaMA-Adapter V2, LLaVA, BLIP-2, and many more! - View it on GitHub

Star

564

Rank

72925

OpenGVLab

OpenGVLab / Multi-Modality-Arena