RyanYr
/

self-correct_ministral8Bit_mMQA_dpo_iter1

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

self-correct_ministral8Bit_mMQA_dpo_iter1 / model-00004-of-00004.safetensors

Commit History

Training in progress, step 68

f069214
verified

RyanYr commited on 1 day ago

Training in progress, step 56

a4191d9
verified

RyanYr commited on 1 day ago

Training in progress, step 42

2ad2874
verified

RyanYr commited on 1 day ago

Training in progress, step 28

75fbe70
verified

RyanYr commited on 1 day ago

Training in progress, step 14

fe8115f
verified

RyanYr commited on 1 day ago