RyanYr
/

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter7

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter7 / last_checkpoint

Commit History

Model save

8cb9589
verified

RyanYr commited on 16 days ago

Model save

3634194
verified

RyanYr commited on 16 days ago

Model save

7cf226e
verified

RyanYr commited on 16 days ago

Training in progress, step 100

be1fb7e
verified

RyanYr commited on 16 days ago