RyanYr
/

self-correct_Ministral-8B-Instruct-2410_metaMathQA_dpo_iter1

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Ministral-8B-Instruct-2410_metaMathQA_dpo_iter1 / model-00002-of-00004.safetensors

Commit History

Training in progress, step 63

58b240a
verified

RyanYr commited on 6 days ago

Training in progress, step 63

feae92f
verified

RyanYr commited on 15 days ago

Training in progress, step 36

b2ba65a
verified

RyanYr commited on 15 days ago

Training in progress, step 36

123ee84
verified

RyanYr commited on 15 days ago

Training in progress, step 36

8626b3c
verified

RyanYr commited on 15 days ago