RyanYr
/

self-correct_Llama-3.2-3B-Instruct_OpenMathInstruct-2_dpo_iter1

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_OpenMathInstruct-2_dpo_iter1

Commit History

Model save

f6e1385
verified

RyanYr commited on 17 days ago

Training in progress, step 124

8cefde4
verified

RyanYr commited on 17 days ago

Training in progress, step 100

f3bdccd
verified

RyanYr commited on 17 days ago

initial commit

21a5655
verified

RyanYr commited on 17 days ago