cool datasets
updated
Viewer
• Updated
• 10k • 6.28k
• 534
rahulchakwate/squad-QG-dataset-original
Viewer
• Updated
• 87.6k • 16
• 2
Viewer
• Updated
• 1k • 51
• 10
Viewer
• Updated
• 98.2k • 101k
• 355
rahulchakwate/squad-QG-dataset-shuffled
Viewer
• Updated
• 87.6k • 10
Gautam9595/Squad_Translated
Viewer
• Updated
• 115k • 18
nreimers/reddit_question_best_answers
Viewer
• Updated
• 1.83M • 74
• 16
Preview
• Updated
• 54
• 35
glaiveai/glaive-code-assistant
Viewer
• Updated
• 136k • 362
• 99
open-web-math/open-web-math
Viewer
• Updated
• 6.32M • 11.7k
• 330
Viewer
• Updated
• 262k • 3.62k
• 299
Viewer
• Updated
• 183k • 1.16k
• 295
Nexusflow/NexusRaven_API_evaluation
Viewer
• Updated
• 1.07k • 160
• 17
alielfilali01/MAD-Main-Test
Viewer
• Updated
• 67.1k • 12
• 1
Viewer
• Updated
• 211k • 91
• 139
migtissera/Tess-Coder-v1.0
Viewer
• Updated
• 117k • 32
• 25
Preview
• Updated
• 149
• 5
Viewer
• Updated
• 135k • 9.58k
• 285
QuixiAI/Code-74k-ShareGPT-Vicuna
Viewer
• Updated
• 73.9k • 16
• 12
Viewer
• Updated
• 109k • 537
• 61
Viewer
• Updated
• 2.75M • 4.36k
• 382
Preview
• Updated
• 65
• 51
Preview
• Updated
• 333
• 193
wyzelabs/RuleRecommendation
Preview
• Updated
• 17
• 18
Updated
• 1.63k
• 7
Viewer
• Updated
• 1.31M • 70
• 23
Updated
• 314
• 6
Locutusque/UltraTextbooks
Viewer
• Updated
• 5.52M • 560
• 198
Updated
• 7.21k
• 997
Viewer
• Updated
• 206k • 3.35k
• 343
Preview
• Updated
• 29
• 49
Locutusque/function-calling-chatml
Viewer
• Updated
• 113k • 374
• 174
lilacai/glaive-function-calling-v2-sharegpt
Viewer
• Updated
• 113k • 184
• 29
Viewer
• Updated
• 45.4k • 90
• 13
unalignment/comedy-snippets-v0.1
Viewer
• Updated
• 44 • 18
• 10
Viewer
• Updated
• 186M • 5.68k
• 36
Viewer
• Updated
• 31.1M • 14.8k
• 676
Viewer
• Updated
• 5.45B • 7.1k
• 517
Updated
• 67.6k
• 134
Viewer
• Updated
• 7.02k • 296
• 134
FreedomIntelligence/ALLaVA-4V
Viewer
• Updated
• 143k • 615
• 93
Viewer
• Updated
• 2M • 26
• 5
Viewer
• Updated
• 1.07k • 195
• 26
Cohere/wikipedia-2023-11-embed-multilingual-v3
Viewer
• Updated
• 247M • 8.36k
• 242
Weyaxi/huggingface-spaces-codes
Viewer
• Updated
• 19.9k • 3.29k
• 11
Updated
• 6.75k
• 65
Viewer
• Updated
• 16.3k • 3.98k
• 99
Updated
• 789
• 1
Viewer
• Updated
• 1.87k • 16
• 1
Viewer
• Updated
• 629 • 14
• 10
NousResearch/json-mode-eval
Viewer
• Updated
• 100 • 819
• 41
NousResearch/func-calling-eval
Viewer
• Updated
• 100 • 13
• 15
Updated
• 20k
• 353
Viewer
• Updated
• 3.41M • 5.14k
• 193
Viewer
• Updated
• 101k • 83
• 65
Viewer
• Updated
• 7.1k • 4.83k
• 159
Viewer
• Updated
• 3.35M • 2.28k
• 22
HuggingFaceM4/the_cauldron
Viewer
• Updated
• 1.88M • 40.6k
• 519
Viewer
• Updated
• 52.5B • 157k
• 2.69k
gate369/alpaca-star-ascii
Viewer
• Updated
• 387 • 14
• 5
Viewer
• Updated
• 765 • 905
• 120
Viewer
• Updated
• 2.49k • 179
• 10
motherduckdb/duckdb-text2sql-25k
Viewer
• Updated
• 25k • 68
• 40
asgaardlab/CommonGameCorruptions
Viewer
• Updated
• 7.19k • 56
• 2
Viewer
• Updated
• 8.01M • 69k
• 496
chansung/merged_ds_coding
Viewer
• Updated
• 60.6k • 30
• 18
PleIAs/Post-OCR-Correction
Viewer
• Updated
• 50.4k • 1.01k
• 135
MemGPT/MemGPT-DPO-Dataset
Viewer
• Updated
• 42.3k • 63
• 11
nthakur/swim-ir-monolingual
Viewer
• Updated
• 3.17M • 382
• 10
nthakur/swim-ir-cross-lingual
Viewer
• Updated
• 15.4M • 1.23k
• 9
Updated
• 277
• 14
Viewer
• Updated
• 31.1k • 1.15k
• 12
AILab-CVC/SEED-Bench-2-plus
Viewer
• Updated
• 555 • 128
• 5
bigcode/self-oss-instruct-sc2-exec-filter-50k
Viewer
• Updated
• 50.7k • 1.59k
• 105
Viewer
• Updated
• 143k • 966
• 15
masakhane/afriqa-gold-passages
Updated
• 129
• 5
masakhane/african-ultrachat
Viewer
• Updated
• 55k • 70
• 5
Viewer
• Updated
• 153k • 3.95k
• 12
Viewer
• Updated
• 1.28B • 670
• 56
Updated
• 4.23k
• 377
NousResearch/CharacterCodex
Viewer
• Updated
• 15.9k • 289
• 228
Viewer
• Updated
• 433k • 208
• 48
allenai/SciRIFF-train-mix
Viewer
• Updated
• 70.7k • 34
• 10
PromptSystematicReview/ThePromptReport
Viewer
• Updated
• 83 • 948
• 46
louisbrulenaudet/legalkit
Viewer
• Updated
• 53k • 109
• 32
microsoft/MeetingBank-LLMCompressed
Viewer
• Updated
• 5.17k • 84
• 16
Viewer
• Updated
• 17.3k • 1.34k
• 34
microsoft/MeetingBank-QA-Summary
Viewer
• Updated
• 862 • 42
• 15
Magpie-Align/Magpie-Qwen2-Pro-1M-v0.1
Viewer
• Updated
• 1M • 107
• 14
Viewer
• Updated
• 2.55M • 13.5k
• 299
Viewer
• Updated
• 486k • 97
• 63
Viewer
• Updated
• 1.75M • 124
• 104
Viewer
• Updated
• 6k • 223
• 196
Viewer
• Updated
• 119k • 5.38k
• 90
CATMuS/medieval-segmentation
Viewer
• Updated
• 1.68k • 153
• 6
antoinejeannot/jurisprudence
Viewer
• Updated
• 2.12M • 319
• 24
Viewer
• Updated
• 39.5k • 15.2k
• 354
HuggingFaceFW/fineweb-edu
Viewer
• Updated
• 3.5B • 222k
• 983
Viewer
• Updated
• 6.91k • 133
• 19
argilla/FinePersonas-v0.1
Viewer
• Updated
• 42.1M • 9.17k
• 408
lmms-lab/LLaVA-Video-178K
Viewer
• Updated
• 1.63M • 15.9k
• 187
Updated
• 19.9k
• 248
recursal/SuperWikiImage-7M
Updated
• 227
• 19
Preview
• Updated
• 115k
• 87
Viewer
• Updated
• 826M • 1.05k
• 64
Updated
• 162
• 86
louisbrulenaudet/lemone-docs-embedded
Viewer
• Updated
• 16.1k • 34
• 3
naijavoices/naijavoices-dataset
Viewer
• Updated
• 1.92M • 1.36k
• 16
Viewer
• Updated
• 12.4M • 1.35k
• 170
Viewer
• Updated
• 824 • 9.51k
• 242
ClovenDoug/150k_keyphrases_labelled
Viewer
• Updated
• 2.26M • 17
• 2
Cour-de-cassation/alpaca_ccass_motivations_sommaires_titres
Viewer
• Updated
• 19.1k • 29
• 3
microsoft/orca-agentinstruct-1M-v1
Viewer
• Updated
• 1.05M • 1.38k
• 460
alpindale/two-million-bluesky-posts
Viewer
• Updated
• 2.11M • 1.07k
• 201
Viewer
• Updated
• 114M • 2.23k
• 101
Viewer
• Updated
• 286k • 211
• 124
agibot-world/AgiBotWorld-Alpha
Viewer
• Updated
• 49.8M • 8.13k
• 213
DAMO-NLP-SG/multimodal_textbook
Updated
• 930
• 157
Viewer
• Updated
• 926k • 1.04k
• 21
bytedance-research/ToolHop
Updated
• 450
• 18
Benchmark
• Updated
• 2.5k • 42.4k
• 738
Viewer
• Updated
• 182k • 235
• 123
ServiceNow-AI/R1-Distill-SFT
Viewer
• Updated
• 1.85M • 1.03k
• 316
open-thoughts/OpenThoughts-114k
Viewer
• Updated
• 228k • 88.1k
• 812
tomg-group-umd/alpaca_cleaned_dataset_short
Viewer
• Updated
• 32 • 7
• 1
Viewer
• Updated
• 5.42M • 551
• 4
MaziyarPanahi/M2Lingual-sharegpt
Viewer
• Updated
• 174k • 12
• 2
Viewer
• Updated
• 4.59k • 441
• 10
Viewer
• Updated
• 307k • 1.28k
• 2
OpenLLM-France/Lucie-Training-Dataset
Viewer
• Updated
• 10.9B • 7.91k
• 34
Viewer
• Updated
• 2.19k • 1k
• 26
Josephgflowers/Finance-Instruct-500k
Viewer
• Updated
• 518k • 915
• 217
facebook/natural_reasoning
Viewer
• Updated
• 1.15M • 1.33k
• 553
Updated
• 2.55k
• 59
Viewer
• Updated
• 3.08M • 283
• 7
VanWang/Bespoke_dpo_filter
Viewer
• Updated
• 10.1k • 7
• 1
VanWang/Bespoke_dpo_filter_len_long
Viewer
• Updated
• 1k • 6
• 1
TheFinAI/Fino1_Reasoning_Path_FinQA
Viewer
• Updated
• 5.5k • 12.8k
• 40
Preview
• Updated
• 80
• 4
declare-lab/AlgoPuzzleVQA
Viewer
• Updated
• 1.8k • 118
• 9
Viewer
• Updated
• 487k • 1.39k
• 102
Viewer
• Updated
• 205 • 2.85k
• 29
Viewer
• Updated
• 160 • 77
• 4
Viewer
• Updated
• 79.5M • 589
• 22
Preview
• Updated
• 566
• 13
Locutusque/Platinum-CoT-v0.1-ShareGPT
Viewer
• Updated
• 2.42k • 6
• 1
gretelai/gretel-safety-alignment-en-v1
Viewer
• Updated
• 16.7k • 176
• 22
Locutusque/deeplm-training-data
Viewer
• Updated
• 2.17M • 86
• 3
Viewer
• Updated
• 1B • 5.2k
• 31
winglian/codeforces-cot-16k-context
Viewer
• Updated
• 24.3k • 10
• 1
glaiveai/reasoning-v1-20m
Viewer
• Updated
• 22.2M • 1.43k
• 233
nvidia/Llama-Nemotron-Post-Training-Dataset
Viewer
• Updated
• 3.91M • 2.81k
• 644
nomic-ai/cornstack-python-v1
Viewer
• Updated
• 23.6M • 2.64k
• 21
Viewer
• Updated
• 254k • 2.44k
• 210
Viewer
• Updated
• 753k • 3.55k
• 527
Viewer
• Updated
• 1.15k • 407
• 101
Anthropic/values-in-the-wild
Viewer
• Updated
• 6.91k • 171
• 145
Viewer
• Updated
• 1.98k • 124
• 33
Viewer
• Updated
• 7.5k • 328
• 18
ZennyKenny/tactical-military-reasoning-v.1.0
Viewer
• Updated
• 150 • 141
• 19
nvidia/Nemotron-CrossThink
Preview
• Updated
• 296
• 113
Preview
• Updated
• 3.87k
• 29
a-m-team/AM-DeepSeek-Distilled-40M
Viewer
• Updated
• 11.5M • 2.03k
• 56
Updated
• 81
• 6
open-r1/Mixture-of-Thoughts
Viewer
• Updated
• 699k • 2.55k
• 306
Viewer
• Updated
• 5.82M • 642
• 63
Viewer
• Updated
• 157M • 359
• 53
facebook/seamless-interaction
Updated
• 47.9k
• 176
MaziyarPanahi/smoltalk2-sft-no-think
Viewer
• Updated
• 1.9M • 140
• 6
facebook/community-alignment-dataset
Viewer
• Updated
• 90.3k • 330
• 39
interstellarninja/hermes_reasoning_tool_use
Viewer
• Updated
• 51k • 309
• 157
Viewer
• Updated
• 1.25M • 4.78k
• 128
MegaScience/TextbookReasoning
Viewer
• Updated
• 652k • 735
• 28
HuggingFaceH4/Multilingual-Thinking
Viewer
• Updated
• 1k • 14.4k
• 111
motionlabs/fineweb-ultra-mini
Viewer
• Updated
• 131k • 59
• 4
Viewer
• Updated
• 168k • 234
• 5
Updated
• 1.94k
• 43
Viewer
• Updated
• 71.4k • 82
• 9
OS-Copilot/OS-Genesis-web-data
Updated
• 14
• 8
Updated
• 752
• 27
Preview
• Updated
• 2.22k
• 73
nvidia/Nemotron-Post-Training-Dataset-v2
Viewer
• Updated
• 6.34M • 7.54k
• 112
Text Generation
• 8B • Updated
• 624
• 68
continuedev/instinct-data
Viewer
• Updated
• 9.04k • 137
• 31
Viewer
• Updated
• 476M • 33.8k
• 823
Viewer
• Updated
• 5.89M • 3.79k
• 89
Preview
• Updated
• 823
• 49
Viewer
• Updated
• 6.35B • 54.3k
• 84
smolagents/aguvis-stage-2
Viewer
• Updated
• 784k • 4.67k
• 26
nvidia/esm2_uniref_pretraining_data
Viewer
• Updated
• 188M • 669
• 7
biglam/doab-metadata-extraction
Viewer
• Updated
• 8.09k • 328
• 12
rl-research/dr-tulu-rl-data
Viewer
• Updated
• 4.88k • 564
• 12
RUC-DataLab/DataScience-Instruct-500K
Viewer
• Updated
• 26.2k • 1.5k
• 73
openbmb/InfLLM-V2-data-5B
Viewer
• Updated
• 7.19M • 372
• 32
OpenMed/Medical-Reasoning-SFT-GPT-OSS-120B
Viewer
• Updated
• 200k • 235
• 250
allenai/Dolci-Think-RL-7B-Completions-SFT
Viewer
• Updated
• 636k • 213
• 8
mahdi-ranjbar/math_search_strategy
Viewer
• Updated
• 40 • 9
• 1
genrobot2025/10Kh-RealOmin-OpenData
Updated
• 52k
• 190
Alibaba-Apsara/Superior-Reasoning-SFT-gpt-oss-120b
Viewer
• Updated
• 306k • 4.96k
• 316
Viewer
• Updated
• 1.86M • 16.6k
• 231
Viewer
• Updated
• 2.56M • 10.3k
• 184