RyanYr
/

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter2-only2nd-6e-7

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter2-only2nd-6e-7

Commit History

Model save

e6d9b73
verified

RyanYr commited on 20 days ago

Training in progress, step 77

6f6a248
verified

RyanYr commited on 20 days ago

initial commit

79a2131
verified

RyanYr commited on 20 days ago