RyanYr
/

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter4

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter4

Commit History

Model save

ae73bbf
verified

RyanYr commited on 19 days ago

Training in progress, step 97

7f6616c
verified

RyanYr commited on 19 days ago

initial commit

94e5637
verified

RyanYr commited on 19 days ago