mimicheng
/

mistral-7b-dpo-qlora-2ep

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

mistral-7b-dpo-qlora-2ep / train_results.json

mimicheng's picture

Model save

47d1a60 verified 10 months ago

194 Bytes

	{
	"epoch": 2.0,
	"train_loss": 0.6517634629204897,
	"train_runtime": 44544.264,
	"train_samples": 61135,
	"train_samples_per_second": 2.745,
	"train_steps_per_second": 0.172
	}