just1nseo
/

zephyr-dpo-qlora-uf-oursuf6k-5e-7

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-dpo-qlora-uf-oursuf6k-5e-7 / runs

1 contributor

History: 8 commits

just1nseo's picture

End of training

2b616b2 verified 4 months ago