just1nseo
/

zephyr-dpo-qlora-uf-ours-5e-6-epoch1

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-dpo-qlora-uf-ours-5e-6-epoch1 / train_results.json

Commit History

Model save

3fb2d1c
verified

just1nseo commited on Jul 29