hZzy
/

qwen2.5-0.5b-expo-DPO-ES-TRY3

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-0.5b-expo-DPO-ES-TRY3

Commit History

End of training

a777d66
verified

hZzy commited on Dec 8, 2024

Model save

dc3c59b
verified

hZzy commited on Dec 8, 2024

Training in progress, step 1056

6e1bd11
verified

hZzy commited on Dec 8, 2024

Training in progress, step 1007

b811562
verified

hZzy commited on Dec 8, 2024

Training in progress, step 954

c535fec
verified

hZzy commited on Dec 8, 2024

Training in progress, step 901

87b2988
verified

hZzy commited on Dec 8, 2024

Training in progress, step 848

a4a1e8d
verified

hZzy commited on Dec 8, 2024

Training in progress, step 795

dd0a35b
verified

hZzy commited on Dec 8, 2024

Training in progress, step 742

5b9d2e3
verified

hZzy commited on Dec 8, 2024

Training in progress, step 689

59c0a57
verified

hZzy commited on Dec 8, 2024

Training in progress, step 636

03042fa
verified

hZzy commited on Dec 8, 2024

Training in progress, step 583

a088d3a
verified

hZzy commited on Dec 8, 2024

Training in progress, step 530

6a3238b
verified

hZzy commited on Dec 8, 2024

initial commit

f534eaf
verified

hZzy commited on Dec 8, 2024