Minbyul
/

llama2-7b-dpo-full-sft-wo-medication_qa

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama2-7b-dpo-full-sft-wo-medication_qa

Commit History

End of training

258753f
verified

Minbyul commited on Apr 29

Model save

fe9c437
verified

Minbyul commited on Apr 29

Training in progress, step 100

f10a998
verified

Minbyul commited on Apr 29

initial commit

ce8dcb5
verified

Minbyul commited on Apr 29