EllieS
/

zephyr-7b-dpo-lora-pubmedqa-ultrafeedback

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-lora-pubmedqa-ultrafeedback

Commit History

Training in progress, step 5000

69322f6
verified

EllieS commited on Jan 17

Training in progress, step 1000

fd7773a
verified

EllieS commited on Jan 17

initial commit

b17b4e7
verified

EllieS commited on Jan 17