RyanYr
/

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter3

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter3

Commit History

Model save

4cb2a4c
verified

RyanYr commited on 21 days ago

Training in progress, step 105

1e08f8d
verified

RyanYr commited on 21 days ago

Training in progress, step 100

c4a1785
verified

RyanYr commited on 21 days ago

initial commit

c77a7ee
verified

RyanYr commited on 21 days ago