mimicheng
/

mistral-7b-dpo-qlora-2ep

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

mistral-7b-dpo-qlora-2ep / trainer_state.json

mimicheng's picture

Model save

47d1a60 verified 10 months ago

413 kB

File too large to display, you can check the raw version instead.