Minbyul
/

biomistral-7b-wo-kqa_golden-iter-dpo-step3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

biomistral-7b-wo-kqa_golden-iter-dpo-step3 / README.md

Commit History

End of training

5d984a5
verified

Minbyul commited on Jun 18

Model save

319f07e
verified

Minbyul commited on Jun 18

End of training

bb5cdad
verified

Minbyul commited on May 10

Model save

010b7d8
verified

Minbyul commited on May 10