HKUST-KnowComp/MARS - Gitstar Ranking

HKUST-KnowComp

Fetched on 2026/03/02 03:10

Code and dataset for the paper: MARS: Benchmarking the Metaphysical Reasoning Abilities of Language Models with a Multi-task Evaluation Dataset (https://arxiv.org/pdf/2406.02106). - View it on GitHub

Star

Rank

2226668

HKUST-KnowComp

HKUST-KnowComp / MARS