RyanYr
/

self-correct_Llama-3.1-8B-Instruct_metaMathQA_dpo_iter1

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.1-8B-Instruct_metaMathQA_dpo_iter1

Commit History

Model save

b57fd4b
verified

RyanYr commited on 20 days ago

Training in progress, step 100

5db90fb
verified

RyanYr commited on 20 days ago

initial commit

bb850b6
verified

RyanYr commited on 20 days ago