RyanYr
/

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter7

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter7 / model-00002-of-00002.safetensors

Commit History

Training in progress, step 108

006f329
verified

RyanYr commited on 16 days ago

Training in progress, step 100

886e9cf
verified

RyanYr commited on 16 days ago

Training in progress, step 108

1c15f49
verified

RyanYr commited on 16 days ago

Training in progress, step 100

009ea74
verified

RyanYr commited on 16 days ago

Training in progress, step 108

4453c09
verified

RyanYr commited on 16 days ago

Training in progress, step 100

be1fb7e
verified

RyanYr commited on 16 days ago