Minbyul
/

selfbiorag-7b-dpo-full-wo-healthsearch_qa-ep3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

selfbiorag-7b-dpo-full-wo-healthsearch_qa-ep3 / config.json

Commit History

End of training

1ba427a
verified

Minbyul commited on Apr 9

Training in progress, step 100

e09961c
verified

Minbyul commited on Apr 9

End of training

14a82c2
verified

Minbyul commited on Mar 29

Model save

c37eb9d
verified

Minbyul commited on Mar 29