Minbyul
/

biomistral-7b-wo-kqa_golden-iter-dpo-step3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

biomistral-7b-wo-kqa_golden-iter-dpo-step3 / config.json

Commit History

End of training

5d984a5
verified

Minbyul commited on Jun 18

Model save

319f07e
verified

Minbyul commited on Jun 18

End of training

bb5cdad
verified

Minbyul commited on May 10

Training in progress, step 100

edcbf9d
verified

Minbyul commited on May 10