RyanYr
/

self-correct_Ministral-8B-Instruct-2410_metaMathQA_dpo_iter1

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Ministral-8B-Instruct-2410_metaMathQA_dpo_iter1

Commit History

Model save

54140b9
verified

RyanYr commited on 15 days ago

Training in progress, step 63

feae92f
verified

RyanYr commited on 15 days ago

Training in progress, step 36

b2ba65a
verified

RyanYr commited on 15 days ago

Training in progress, step 36

123ee84
verified

RyanYr commited on 15 days ago

Training in progress, step 36

8626b3c
verified

RyanYr commited on 15 days ago

initial commit

7286a67
verified

RyanYr commited on 15 days ago