RyanYr
/

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter5_lr3e-7

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter5_lr3e-7

Commit History

Training in progress, step 107

cf45051
verified

RyanYr commited on 16 days ago

Training in progress, step 100

a6be032
verified

RyanYr commited on 16 days ago

initial commit

b74c18b
verified

RyanYr commited on 16 days ago