RyanYr
/

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter7

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_Llama-3.2-3B-Instruct_metaMathQA_dpo_iter7 / training_args.bin

Commit History

Training in progress, step 100

886e9cf
verified

RyanYr commited on 16 days ago

Training in progress, step 100

009ea74
verified

RyanYr commited on 16 days ago

Training in progress, step 100

be1fb7e
verified

RyanYr commited on 16 days ago