EllieS
/

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-com

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-com / runs /Feb22_06-18-14_586cb8b6da8c /events.out.tfevents.1708615128.586cb8b6da8c.10523.1

Commit History

Model save

e1de556
verified

EllieS commited on Feb 22