RyanYr
/

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter7

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter7

Commit History

Model save

8cb9589
verified

RyanYr commited on 16 days ago

Training in progress, step 108

006f329
verified

RyanYr commited on 16 days ago

Training in progress, step 100

886e9cf
verified

RyanYr commited on 16 days ago

Model save

3634194
verified

RyanYr commited on 16 days ago

Training in progress, step 108

1c15f49
verified

RyanYr commited on 16 days ago

Training in progress, step 100

009ea74
verified

RyanYr commited on 16 days ago

Model save

7cf226e
verified

RyanYr commited on 16 days ago

Training in progress, step 108

4453c09
verified

RyanYr commited on 16 days ago

Training in progress, step 100

be1fb7e
verified

RyanYr commited on 16 days ago

initial commit

66a95ac
verified

RyanYr commited on 16 days ago