RyanYr
/

self-correct_Ministral-8B-Instruct-2410_metaMathQA_dpo_iter2

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Ministral-8B-Instruct-2410_metaMathQA_dpo_iter2

Commit History

Model save

660446a
verified

RyanYr commited on 14 days ago

Training in progress, step 46

f29a0b1
verified

RyanYr commited on 14 days ago

initial commit

d3d6b6f
verified

RyanYr commited on 14 days ago