RyanYr
/

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter2

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter2

Commit History

Model save

484aa96
verified

RyanYr commited on 22 days ago

Training in progress, step 100

a86e719
verified

RyanYr commited on 22 days ago

initial commit

26f87f5
verified

RyanYr commited on 22 days ago