EllieS
/

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-com

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community