RyanYr
/

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter1

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter1 / model-00002-of-00002.safetensors

Commit History

Model save

390391e
verified

RyanYr commited on 20 days ago

Training in progress, step 100

48f76e5
verified

RyanYr commited on 20 days ago

Model save

5bef704
verified

RyanYr commited on 22 days ago

Training in progress, step 100

e432224
verified

RyanYr commited on 22 days ago