RyanYr
/

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter6

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter6

Commit History

Training in progress, step 103

af67a11
verified

RyanYr commited on 18 days ago

Training in progress, step 100

690d6ff
verified

RyanYr commited on 18 days ago

initial commit

c2e8b1b
verified

RyanYr commited on 18 days ago