MichaelR207
/

mistral-sft-7b-dpo-qlora

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

mistral-sft-7b-dpo-qlora / adapter_model.safetensors

Commit History

Model save

53d9518
verified

MichaelR207 commited on Mar 4, 2024

Model save

13be604
verified

MichaelR207 commited on Mar 4, 2024

Model save

505fdcd
verified

MichaelR207 commited on Mar 4, 2024

Model save

fa2e5b9
verified

MichaelR207 commited on Mar 4, 2024