sfulay
/

zephyr-7b-dpo-full-magpi-reward-scale-1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

zephyr-7b-dpo-full-magpi-reward-scale-1

Commit History

Model save

0d3f7c6
verified

sfulay commited on Aug 21, 2024

Model save

64c9089
verified

sfulay commited on Aug 21, 2024

Model save

f4eb1b5
verified

sfulay commited on Aug 20, 2024

Model save

3053942
verified

sfulay commited on Aug 14, 2024

Training in progress, step 352

34aed1b
verified

sfulay commited on Aug 14, 2024

Training in progress, step 300

4748676
verified

sfulay commited on Aug 14, 2024

Training in progress, step 200

7165d2a
verified

sfulay commited on Aug 14, 2024

initial commit

1fa92cd
verified

sfulay commited on Aug 14, 2024