RyanYr
/

self-correct_Ministral-8B-Instruct-2410_metaMathQA_dpo_iter4_lr1e-7

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Ministral-8B-Instruct-2410_metaMathQA_dpo_iter4_lr1e-7

Commit History

Model save

226fbb8
verified

RyanYr commited on 13 days ago

Training in progress, step 42

f6b3e4a
verified

RyanYr commited on 13 days ago

initial commit

803c1bf
verified

RyanYr commited on 13 days ago