sfulay
/

zephyr-7b-dpo-full-gpt_consistent-reward-scale-1

Generated from Trainer

Model card Files Files and versions Community

zephyr-7b-dpo-full-gpt_consistent-reward-scale-1

Commit History

Model save

180937f
verified

sfulay commited on Aug 28

Training in progress, step 436

905b239
verified

sfulay commited on Aug 28

Training in progress, step 400

b9f4a21
verified

sfulay commited on Aug 28

Training in progress, step 300

92bb885
verified

sfulay commited on Aug 28

Training in progress, step 200

775b078
verified

sfulay commited on Aug 28

initial commit

6f37815
verified

sfulay commited on Aug 28