Evaluation datasets

community

AI & ML interests

None defined yet.

Collections 9

View 9 collections

models 1

lighteval/different-chat-templates-per-revision

Updated May 15, 2025

datasets 192

lighteval/agi_eval_en

Viewer • Updated Dec 18, 2025 • 3.37k • 457 • 4

lighteval/piqa

Viewer • Updated Nov 21, 2025 • 21k • 6.27k • 1

lighteval/logiqa_harness

Updated Aug 19, 2025 • 89

lighteval/sacrebleu_manual

Viewer • Updated Aug 19, 2025 • 936k • 4.68k

lighteval/lextreme

Viewer • Updated Aug 19, 2025 • 194k • 679 • 1

lighteval/bbh

Viewer • Updated Aug 18, 2025 • 78.3k • 873 • 1

lighteval/synthetic_reasoning

Viewer • Updated Aug 18, 2025 • 33k • 133 • 8

lighteval/covid_dialogue

Viewer • Updated Aug 18, 2025 • 614 • 41 • 1

lighteval/numeracy

Viewer • Updated Aug 18, 2025 • 1.6k • 45 • 2

lighteval/synthetic_reasoning_natural

Viewer • Updated Aug 18, 2025 • 22k • 38 • 15

View 192 datasets