RyanYr
/

self-correct_Ministral-8B-Instruct-2410_metaMathQA_dpo_iter3

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Ministral-8B-Instruct-2410_metaMathQA_dpo_iter3

Commit History

Model save

e8eb0e3
verified

RyanYr commited on 14 days ago

Training in progress, step 45

6a6927b
verified

RyanYr commited on 14 days ago

initial commit

d3ae24e
verified

RyanYr commited on 14 days ago