google-research-datasets/answer-equivalence-dataset

google-research-datasets

Fetched on 2026/03/01 20:06

This dataset contains human judgements about answer equivalence. The data is based on SQuAD (Stanford Question Answering Dataset), and contains 9k human judgements of answer candidates generated by Albert on the SQuAD train set, and an additional 14k human judgements for answer candidates produced by BiDAF, Luke, and XLNet on the SQuAD dev set. - View it on GitHub

Star

Rank

813752

google-research-datasets

google-research-datasets / answer-equivalence-dataset