sfulay
/

zephyr-7b-dpo-full-gpt-reward-scale-01

Generated from Trainer

Model card Files Files and versions Community

zephyr-7b-dpo-full-gpt-reward-scale-01 / model-00002-of-00003.safetensors

Commit History

Training in progress, step 436

0dbdb13
verified

sfulay commited on Sep 2, 2024

Training in progress, step 400

a690582
verified

sfulay commited on Sep 2, 2024

Training in progress, step 300

bd73342
verified

sfulay commited on Sep 2, 2024

Training in progress, step 200

4a29987
verified

sfulay commited on Sep 2, 2024

Training in progress, step 100

dd59802
verified

sfulay commited on Sep 2, 2024