sfulay
/

zephyr-7b-dpo-full-prometheus-reward-scale-05

Generated from Trainer

Model card Files Files and versions Community

zephyr-7b-dpo-full-prometheus-reward-scale-05 / model-00002-of-00003.safetensors

Commit History

Training in progress, step 437

d2f6dd3
verified

sfulay commited on Aug 28, 2024

Training in progress, step 400

834c1df
verified

sfulay commited on Aug 28, 2024

Training in progress, step 300

d638c04
verified

sfulay commited on Aug 28, 2024

Training in progress, step 200

dd34deb
verified

sfulay commited on Aug 28, 2024

Training in progress, step 100

24a1e00
verified

sfulay commited on Aug 28, 2024

Training in progress, step 437

64f09a9
verified

sfulay commited on Aug 21, 2024

Training in progress, step 400

2ebd77f
verified

sfulay commited on Aug 21, 2024

Training in progress, step 300

4d6028b
verified

sfulay commited on Aug 21, 2024

Training in progress, step 200

56b9724
verified

sfulay commited on Aug 21, 2024

Training in progress, step 100

1641d38
verified

sfulay commited on Aug 21, 2024