cambridgeltl/visual-spatial-reasoning

cambridgeltl

Fetched on 2026/03/02 10:24

[TACL'23] VSR: A probing benchmark for spatial undersranding of vision-language models. - View it on GitHub

Star

139

Rank

239589